SageMaker HyperPod 現在支援運算資源的細微配額分配

張貼日期: 2025年8月14日

SageMaker HyperPod 任務治理現在支援執行個體內 GPU、Trainium 加速器、vCPU 和 vCPU 記憶體的精細運算配額分配。管理員可以在團隊間分配精細的運算配額，從而最佳化運算資源分佈，並將開支控制在預算範圍內。

資料科學家經常執行不需要完整 HyperPod 執行個體的 LLM 工作 (例如訓練或推論)，從而導致加速運算資源的使用率不足。HyperPod 任務治理可讓管理員管理團隊間的運算配額分配。有了這項功能，管理員現在可以策略性地分配運算資源，確保公平存取、防止資源獨佔，並將叢集使用率提升至最高。此功能除了執行個體層級分配之外，還可以實現精細的運算配額分配，並滿足組織工作負載需求。

提供 HyperPod 的所有 AWS 區域均可使用 SageMaker HyperPod 任務治理：美國東部 (維吉尼亞北部)、美國西部 (加利佛尼亞北部)、美國西部 (奧勒岡)、亞太地區 (孟買)、亞太地區 (新加坡)、亞太地區 (雪梨) 和亞太地區 (東京)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (倫敦)、歐洲 (斯德哥爾摩) 和南美洲 (聖保羅)。

若要進一步了解，請造訪 SageMaker HyperPod 網頁，以及 HyperPod 任務治理文件。

SageMaker HyperPod 現在支援運算資源的細微配額分配

了解

資源

開發人員

說明