投稿日: Apr 17, 2024
Amazon SageMaker Studio の JupyterLab Notebook には、SQL 拡張機能が組み込まれています。これにより、データサイエンティストは、ノートブックから SQL と Python を使用して複数のデータソースのデータをシームレスに発見、探索、変換できます。
Studio ノートブックを扱うデータサイエンティストは、AWS Glue 接続を介して Amazon Athena、Amazon Redshift、Snowflake などの一般的なデータサービスにシームレスに接続できるようになりました。管理者はこれらの接続を安全に管理できるため、データサイエンティストは認証情報を手動で管理しなくても、承認されたデータにアクセスできます。データソースに接続すると、データサイエンティストはデータベース、スキーマ、テーブル、およびビューを簡単に参照および検索でき、ノートブックインターフェイス内でデータをプレビューできます。その後、SQL コードと Python コードを同じノートブックに混在させて、機械学習プロジェクトで使用するデータを効率的に探索および変換できます。SQL コマンド補完、コードフォーマット支援、構文の強調表示などの追加機能により、コード開発を迅速化し、開発者全体の生産性を向上させることができます。SageMaker Studio は、一般的なデータサービス、SQL/Python でのデータ探索、エンドツーエンドの機械学習を統一されたユーザーインターフェイスに統合することで、データサイエンティストが分析や機械学習の作業中にツールを切り替える手間を減らし、大幅な時間の節約と生産性の向上を実現します。
この機能は、SageMaker Studio が提供されているすべての商用 AWS リージョンで利用できます。
詳細については、このブログと SageMaker 開発者ガイドをご覧ください。