投稿日: Nov 29, 2023

本日、Amazon SageMaker Pipelines の簡素化されたデベロッパーエクスペリエンスの一般提供が開始されたことを発表します。改善された Python SDK により、使い慣れた Python 構文を使用して機械学習 (ML) ワークフローをすばやく構築できます。SDK の主な機能には、カスタムステップ用の新しい Python デコレーター (@step)、ノートブックジョブのステップタイプ、ワークフロースケジューラが含まれます。

ML 開発では、多くの場合、ローカル開発環境 (Jupyter Notebookなど) での実験用のモノリシック Python コードから始まり、その後、分離されたパイプラインステップを通じて実行を自動化することを決定します。Amazon SageMaker Pipelines の新しいデベロッパーエクスペリエンスでは、ML コードをさまざまな ML ステップの自動化された有向非巡回グラフ (DAG) に数分で変換できます。ML ワークフローを作成するには、既存の Python 関数に '@step' デコレータで注釈を付け、最後のステップをパイプライン作成 API に渡します。Amazon SageMaker は、注釈付きの Python 関数間の依存関係を自動的に解釈し、それぞれに対してカスタムパイプラインステップを作成して、パイプライン DAG を生成します。ML コードが複数の Python ノートブックに分散している場合は、それらをつなぎ合わせてノートブックジョブのワークフローを調整できます。後でワークフローを定期的に自動実行したい場合は、新しい Python SDK で 1 つの関数呼び出しを使用して実行スケジュールを設定できます。

開始するには、GitHub の事前構築されているサンプルノートブックのいずれかを使用して ML ワークフローを作成し、それを Amazon SageMaker Studio UI で可視化します。追加情報については、Amazon SageMaker Pipelines のデベロッパーガイドをご覧ください。