投稿日: Nov 29, 2023

Amazon SageMaker ノートブックジョブを使用すると、データサイエンティストは、機械学習 (ML) 用のウェブベースの IDE である Amazon SageMaker Studio で数回クリックするだけで、オンデマンドまたはスケジュールに従ってノートブックを実行できます。本日、SageMaker の ML ワークフローオーケストレーションサービスである SageMaker Pipelines で提供される API を使用して、ノートブックをプログラムでジョブとして実行可能になったことをお知らせします。さらに、これらの API を使用して、複数の依存ノートブックを含むマルチステップの ML ワークフローを作成できます。

データサイエンティストは、長時間稼働するノートブックの実行、定期的なレポート生成、小規模なサンプルデータセットの準備からペタバイト規模のビッグデータの処理へのスケールアップなどのユースケースに SageMaker ノートブックジョブを使用できます。これらのノートブックを本番環境に移行する場合、お客様は CI/CD ワークフローの一部としてノートブックをプログラムで実行するための API サポートが必要です。今回のリリースでは、Amazon SageMaker Pipelines を使用してパイプラインを構築する際の組み込みステップタイプとしてノートブックジョブが導入されます。お客様はこのノートブックジョブステップを活用して、Amazon SageMaker Python SDK を使用してわずか数行のコードで簡単にノートブックをジョブとして実行できます。さらに、複数の依存ノートブックをつなぎ合わせて、有向非巡回グラフ (DAG) 形式のワークフローを作成することもできます。その後、これらのノートブックジョブまたは DAG を実行し、Amazon SageMaker Studio を使用してそれらを管理および可視化できます。

この機能は、Amazon SageMaker Studio が提供されているすべての AWS 商用リージョンで一般提供されます。詳細については、 SageMaker Studio のデベロッパーガイドまたはこの機能に関するブログを参照してください。