Amazon SageMaker HyperPod 現在支援 Spot 執行個體
張貼日期:
2025年11月24日
Amazon SageMaker HyperPod 現在支援 Spot 執行個體,與 HyperPod 上的隨需執行個體相比,客戶能夠降低高達 90%的 GPU 運算成本。隨著 AI 工作負載的規模不斷擴展,最佳化基礎結構成本變得愈發關鍵。SageMaker HyperPod 的 Spot 整合會透過允許客戶以大幅折扣自動利用閒置的 EC2 容量來解決此問題,同時維護客戶在 HyperPod 上所享有的受管 AI 體驗。
有了 Spot 執行個體,組織能夠經濟實惠的大規模執行容錯工作負載。您可以將 Spot 執行個體與隨需執行個體結合,以在成本最佳化與保證的可用性上達成平衡。此功能適用於 HyperPod EKS 叢集,並與 Karpenter 整合以提供智慧型自動擴展功能,從而自動探索可用的 Spot 容量並處理執行個體中斷。
您可以在透過 CreateCluster API 或 AWS Console 建立執行個體群組時,啟用 Spot 執行個體。此功能支援 HyperPod 上可用的所有執行個體類型,包括 CPU 和 GPU。容量可用性取決於 EC2 的供應情況,並會因區域和執行個體類型而異。Spot 執行個體支援適用於目前提供 SageMaker HyperPod 的所有區域。若要進一步了解,請參閱文件。