Amazon SageMaker HyperPod がフレキシブルトトレーニングプランの提供を開始

投稿日: 2024年12月4日

Amazon SageMaker HyperPod はフレキシブルトトレーニングプランを発表しました。これは、タイムラインと予算内で生成 AI モデルをトレーニングできる新機能です。これにより、モデルトレーニングのタイムラインが予測可能になり、予算の要件内でトレーニングワークロードを実行できます。同時に、耐障害性、パフォーマンスが最適化された分散トレーニング、オブザーバビリティとモニタリングの強化など、SageMaker HyperPod の機能を引き続き活用できます。 

生成 AI のモデルトレーニングについて、希望するコンピューティングインスタンス、必要なコンピューティングリソースの量、ワークロードの期間、希望開始日を数ステップで指定できます。その後 SageMaker で最も費用対効果の高いトレーニングプランを作成でき、モデルのトレーニングにかかる時間を数週間単位で短縮できます。トレーニングプランを作成して購入すると、SageMaker によって自動的にインフラストラクチャがプロビジョニングされ、これらのコンピューティングリソースでトレーニングワークロードが実行されます。手動で操作する必要はありません。また、あるキャパシティブロックから別のキャパシティブロックにプランが切り替わると、コンピューティングの可用性にギャップがある間のトレーニングの一時停止と再開が SageMaker によって自動的に処理されます。インフラストラクチャ管理の面倒な作業をすべて排除するために、SageMaker のフルマネージド型トレーニングジョブを使用してトレーニングプランを作成して実行することもできます。  

SageMaker HyperPod フレキシブルトレーニングプランは、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン) の各 AWS リージョンでご利用いただけます。詳細については、SageMaker HyperPodドキュメント発表についてのブログを参照してください。