AWS Batch 現在支援適用於 SageMaker 訓練任務的配額管理和’搶佔

張貼日期: 2026年3月25日

AWS Batch 現在支援適用於 SageMaker 訓練任務的配額管理和任務先佔功能,讓您能在團隊和專案之間有效地分配及共用運算資源。如果您在 SageMaker 訓練任務中使用 GPU 容量,您現在能以智慧方式分配運算資源、優先處理業務關鍵工作負載,並在有緊急實驗時自動對優先順序較低的工作負載進行搶佔。

透過配額管理,每個任務佇列最多可建立 20 個配額共用,這些配額共用將以具有專用容量限制和可設定資源共用策略之虛擬佇列的形式運作。該服務會在原始擁有者提交任務時自動使用跨共用搶佔來恢復借用的容量,同時也支援共用內搶佔,以允許相同配額共用內的高優先順序任務對低優先順序任務進行搶佔。您可以監控佇列中的容量使用率、配額共用以及工作層級的精細度;在提交後更新工作優先順序以影響搶佔決策,並設定搶佔重試限制以控制行為。該功能會透過 aws_batch 模組直接與 SageMaker Python SDK 整合。

適用於 SageMaker 訓練任務的配額管理和任務搶佔,現已在所有提供 AWS Batch 的 AWS 區域中推出。如需詳細資訊,請參閱我們在 GitHub 上的配額管理範例筆記本AWS Batch 使用者指南