Amazon SageMaker HyperPod がスポットインスタンスをサポート
Amazon SageMaker HyperPod がスポットインスタンスをサポートするようになり、お客様は HyperPod のオンデマンドインスタンスと比較して GPU コンピューティングコストを最大 90% 削減できます。AI ワークロードがスケールするにつれて、インフラストラクチャコストの最適化がますます重要になっています。SageMaker HyperPod のスポット統合は、お客様が HyperPod で享受できるマネージド AI エクスペリエンスを提供しながら、大幅な割引価格で予備の EC2 容量を自動的に活用できるようにすることで、この課題に対処します。
スポットインスタンスを使用すると、組織はフォールトトレラントなワークロードをコスト効率よく大規模に実行できます。スポットインスタンスとオンデマンドインスタンスを組み合わせて、コストの最適化と可用性の保証のバランスを取ることができます。この機能は HyperPod EKS クラスターで利用でき、Karpenter と統合してインテリジェントな自動スケーリングを行い、利用可能なスポット容量を自動的に検出してインスタンスの中断の対処します。
CreateCluster API または AWS コンソールを使用してインスタンスグループを作成するときに、スポットインスタンスを有効にできます。この機能は、CPU や GPU を含む、HyperPod で利用できるすべてのインスタンスタイプをサポートします。利用可能な容量は EC2 からの供給に依存し、リージョンとインスタンスタイプによって異なります。スポットインスタンスのサポートは、SageMaker HyperPod が現在利用可能なすべてのリージョンで利用できます。詳細については、ドキュメントをご覧ください。