AWS Batch が SageMaker トレーニングジョブのスケジューリングのサポートを開始

投稿日: 2025年7月31日

本日より、AWS Batch は SageMaker トレーニングジョブのスケジューリングをサポートするようになりました。SageMaker トレーニングジョブ用の AWS Batch を使用すると、データサイエンティストは AWS Batch を使用した設定可能なキューにトレーニングジョブを送信できます。こうした連携により、優先順位とリソースの可用性に基づいてジョブをスケジュールできるため、手動で再試行したり調整したりする必要がなくなります。さらに、システム管理者は公平なスケジューリングポリシーを設定して、チーム間のリソース利用状況を最適化できます。システムは失敗したジョブを自動的に再試行し、キューの状態を可視化します。

また、SageMaker フレキシブルトレーニングプラン (FTP) を利用することで、必要な時に必要なキャパシティを確保することもできます。フレキシブルトレーニングプランを導入すると、AWS Batch のキューイング機能により、プラン期間中の使用率を最大限に高めることができます。複雑なインフラストラクチャが自動的に処理されるため、データサイエンティストは SageMaker Python SDK から直接自信を持って実験を送信できます。

SageMaker トレーニングジョブ用の AWS Batch は、AWS マネジメントコンソール、AWS コマンドラインインターフェイス (CLI)、または AWS SDK を使用してすぐに使い始めることができます。AWS Batch 自体に追加料金はかかりません。アプリケーションの実行に使用された AWS リソースに対してのみ請求が発生します。SageMaker トレーニングジョブ用の AWS Batch は、AWS Batch と SageMaker AI が利用できるすべての商用 AWS リージョンで一般提供が開始されました。使用を開始するには、SageMaker トレーニングジョブ用の AWS Batch に関するドキュメントブログ記事を参照してください。