Amazon SageMaker HyperPod 現在支援用於生成式 AI 任務的 NVIDIA 多執行個體 GPU (MIG)
Amazon SageMaker HyperPod 現在支援 NVIDIA 多執行個體 GPU (MIG) 技術,使管理員得以將單一 GPU 分割成多個隔離式 GPU。此功能能夠讓管理員在 GPU 分割區上同時執行各種小型生成式 AI (GenAI) 任務,同時維持效能和任務隔離狀態,最大限度地提高資源使用率。
管理員可以選擇 SageMaker HyperPod 主控台上易於使用的組態設定,或是選擇自訂設定方法以啟用精細的硬體隔離資源,從而滿足不需要完整 GPU 容量的特定任務需求。他們還可以分配運算配額,以確保在團隊之間公平和有效率地分配 GPU 分割區。透過 GPU 分割區的即時效能指標和資源使用率監控儀表板,管理員能夠獲得用於最佳化資源配置所需的可見性。資料科學家現在能夠透過排程輕量的推論工作,並在 GPU 分割區上平行執行互動式筆記本,從而減少等待完整 GPU 可用性的時間,加速產品上市時間。
此功能目前在下列 AWS 區域適用於使用 EKS 協調器的 Amazon SageMaker HyperPod 叢集:美國西部 (奧勒岡)、美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (加利佛尼亞北部)、加拿大 (中部)、南美洲 (聖保羅)、歐洲 (斯德哥爾摩)、歐洲 (西班牙)、歐洲 (愛爾蘭)、歐洲 (法蘭克福)、歐洲 (倫敦)、亞太地區 (孟買)、亞太區域 (雅加達)、亞太區域 (墨爾本)、亞太地區 (東京)、亞太地區 (雪梨)、亞太地區 (首爾)、亞太地區 (新加坡)。
若要進一步了解,請前往 SageMaker HyperPod 網頁,並瀏覽 SageMaker HyperPod 文件。