Amazon SageMaker Unified Studio ノートブックで EMR Serverless のサポートを開始
Amazon SageMaker Unified Studio ノートブックは、Apache Spark Connect を使用した Amazon EMR Serverless をサポートするようになりました。これにより、データエンジニアとアナリストは、インタラクティブ分析やデータエンジニアリングワークロード向けの Spark ランタイムをより柔軟に選択できます。Amazon Athena Spark に加えて、Amazon EMR Serverless を Spark ランタイムとして利用できるため、要件に基づいて最適なエンジンを選択できます。
今回のリリースにより、ノートブックのセル内で EMR Serverless Spark アプリケーション上の PySpark と Spark SQL を実行できます。ユーザーはノートブックのサイドパネルから Spark ランタイムを選択でき、選択したランタイムは Python セルと SQL セルの両方に適用されます。さらに、組み込みの AI アシスタントである SageMaker Data Agent を利用すると、自然言語のプロンプトからコードや実行プランを生成できるため、EMR Serverless を使った Spark 開発ワークフローを加速できます。組織は、事前に初期化された容量を活用することでセッション開始時間を短縮できます。また、サポートされるすべてのエンジンにわたって統合された Spark UI モニタリングを利用できるため、ジョブの実行とパフォーマンスを一貫して確認できます。加えて、EMR Serverless は、ネットワーク分離が必要なワークロード向けに VPC 接続をサポートしています。
この機能は、Amazon SageMaker Unified Studio が提供されているすべての AWS リージョンで利用でき、SageMaker Unified Studio ノートブック環境と JupyterLab IDE 環境の両方をサポートしています。利用を開始するには、Amazon SageMaker Unified Studio ユーザーガイドを参照してください。