SageMaker HyperPod 現在支援運算資源的細微配額分配

張貼日期: 2025年8月14日

SageMaker HyperPod 任務治理現在支援執行個體內 GPU、Trainium 加速器、vCPU 和 vCPU 記憶體的精細運算配額分配。管理員可以在團隊間分配精細的運算配額,從而最佳化運算資源分佈,並將開支控制在預算範圍內。

資料科學家經常執行不需要完整 HyperPod 執行個體的 LLM 工作 (例如訓練或推論),從而導致加速運算資源的使用率不足。HyperPod 任務治理可讓管理員管理團隊間的運算配額分配。有了這項功能,管理員現在可以策略性地分配運算資源,確保公平存取、防止資源獨佔,並將叢集使用率提升至最高。此功能除了執行個體層級分配之外,還可以實現精細的運算配額分配,並滿足組織工作負載需求。

提供 HyperPod 的所有 AWS 區域均可使用 SageMaker HyperPod 任務治理:美國東部 (維吉尼亞北部)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、亞太地區 (孟買)、亞太地區 (新加坡)、亞太地區 (雪梨) 和亞太地區 (東京)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (斯德哥爾摩) 和南美洲 (聖保羅)。

若要進一步了解,請造訪 SageMaker HyperPod 網頁,以及 HyperPod 任務治理文件