发布于: Nov 20, 2018
AWS Batch 现在支持多节点并行作业,使您能够运行需要多个 EC2 实例的单个作业。对于具有紧密耦合的分布式计算工作负载的客户而言,多节点并行作业允许他们利用 AWS Batch 的完全托管批处理计算功能,避免配置、管理、监控和扩展计算集群时遇到的复杂性,降低成本和运营开销。
借助多节点并行作业支持,开发人员、数据科学家和工程师现在可以轻松高效地运行工作负载,例如,大规模紧密耦合的高性能计算应用和分布式 GPU 模型训练。您可以将自己的 Docker 容器与首选框架和库结合使用,例如 Apache MXNet、TensorFlow、Caffe2 和消息传递接口 (MPI)。AWS Batch 将执行作业和管理计算资源,从而让您能够集中精力分析结果,而不是设置和管理基础设施。现在可以在 AWS Batch 上运行的工作负载类型包括:计算流体动力学、天气预报、气候仿真、深度学习模型训练和结构应力分析等。