Amazon SageMaker AI 現在支援 P6e-GB200 UltraServers

張貼日期: 2025年8月12日

Amazon SageMaker AI 今日宣佈支援在 SageMaker HyperPod訓練任務中使用 P6e-GB200 UltraServers。有了 P6e-GB200 UltraServers,您可以在單一 NVLink 網域下運用多達 72 顆 NVIDIA Blackwell GPU,透過具有數兆個參數的基礎模型加速訓練和部署作業。P6e-GB200 UltraServers 有兩種尺寸可供選擇:ml.u-p6e-gb200x72 (NVLink 內有 72 顆 GPU) 和 ml.u-p6e-gb200x36 (NVLink 內有 36 顆 GPU)。

與 P5en 執行個體相比,P6e-GB200 UltraServers 可在單一 NVIDIA NVLink 下提供超過 20 倍的運算能力和 11 倍以上的記憶體容量。在每個 NVLink 網域中,您可以利用 360 PFLOPS 的 FP8 運算能力 (不含稀疏化處理) 和總計 13.4 TB 的高頻寬記憶體 (HBM3e)。當您在 SageMaker AI 上使用 P6e-GB200 UltraServers 時,您將獲得 GB200 的卓越效能,並結合 SageMaker 的受管基礎架構,例如安全性、內建容錯、拓樸感知排程 (SageMaker HyperPod EKS 和 Slurm)、整合式監控功能,以及與其他 SageMaker AI 和 AWS 服務的原生整合。

您可透過達拉斯本地區域 ("us-east-1-dfw-2a") 的 SageMaker 彈性訓練方案使用 UltraServers,達拉斯本地區域為美國東部 (維吉尼亞北部) AWS 區域的延伸區域。如需隨需預訂 GB200 UltraServers,請聯絡您的客戶經理。Amazon SageMaker AI 讓您能夠使用針對效能和成本最佳化的完全受管基礎架構,輕鬆地大規模訓練和部署機器學習模型。若要著手使用 SageMaker AI 上的 UltraServers,請參閱文件