Amazon SageMaker HyperPod 現在提供彈性的訓練計劃

張貼日期: 2024年12月4日

Amazon SageMaker HyperPod 宣布彈性的訓練計劃,這項新功能可讓您在符合時程和預算的情況下訓練生成式 AI 模型。取得可預測的模型訓練時程,並在預算需求內執行訓練工作負載,同時繼續受益於 SageMaker HyperPod 的功能,例如備援、效能最佳化的分散式訓練以及增強的可觀測性和監控。 

您可以在幾個快速步驟中,指定偏好的運算執行個體、所需的運算資源量、工作負載的持續時間,以及生成式 AI 模型訓練的偏好開始日期。然後,SageMaker 可協助您建立最具成本效益的訓練計劃,從而縮短數週的模型訓練時間。建立和購買訓練計劃後,SageMaker 會在這些運算資源上自動佈建基礎架構並執行訓練工作負載,而不需要任何人工干預。隨著計劃從某個容量區塊切換到另一個容量區塊,SageMaker 也會在運算可用性間隙之間自動處理暫停和恢復訓練。如果想要移除基礎架構管理的所有繁重工作,您也可以使用 SageMaker 全受管的訓練工作建立和執行訓練計劃。  

SageMaker HyperPod 彈性訓練計劃已在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) AWS 區域推出。若要進一步了解,請瀏覽 SageMaker HyperPod文件公告部落格。