AWS Batch 现在支持调度 SageMaker 训练作业
发布于:
2025年7月31日
即日起,AWS Batch 现已支持调度 SageMaker 训练作业。借助 AWS Batch for SageMaker 训练作业,数据科学家能够将训练作业提交到由 AWS Batch 提供支持的可配置队列。这种集成可以根据优先级和资源可用性来调度作业,无需您手动重试和协调。此外,系统管理员可以设置公平共享调度策略,以优化各团队的资源利用率。系统将自动重试失败的作业,并提供队列状态的可见性。
您还可以购买 SageMaker 灵活训练计划 (FTP),以保证在需要时获得所需的容量。有了灵活训练计划,您可以利用 Batch 的排队功能在计划有效期内最大限度地提高利用率。数据科学家知道基础设施复杂问题已由系统自动处理,因此可以直接从 SageMaker Python SDK 放心地提交实验。
您可以通过 AWS 管理控制台、AWS 命令行界面 (CLI) 或 AWS SDK 立即开始使用 AWS Batch for SageMaker 训练作业。AWS Batch 本身没有额外费用,您只需为用于运行应用程序的 AWS 资源付费。AWS Batch for SageMaker 训练作业现已在提供 AWS Batch 和 SageMaker AI 的所有 AWS 商业区域全面推出。要开始使用,请参阅 AWS Batch for SageMaker 训练作业文档和我们的博客文章。