Amazon ECS 托管实例现已支持 AWS Trainium 和 AWS Inferentia

发布于: 2026年6月3日

Amazon Elastic Container Service(Amazon ECS)托管实例现已支持 AWS TrainiumAWS Inferentia,它们是专用 AI 加速器,旨在为各种生成式人工智能工作负载的训练和推理提供可扩展的性能和成本效益。Amazon ECS 托管实例是一种完全托管式计算选项,旨在消除基础设施管理开销,同时让您能够充分使用 Amazon EC2 的完整功能。通过将基础设施运营工作移交至 AWS,ECS 托管实例可帮助您快速启动和扩展工作负载,同时提升性能并降低总体拥有成本。

借助 ECS 托管实例,您既能获得所需的应用性能,又能享受操作的简便性。现在,您可以创建一个 ECS 托管实例容量提供程序,并选择所需的加速实例类型(包括 Inferentia2、Trainium1 和 Trainium2),然后在任务定义的 ResourceRequirement 部分中添加 NEURON_CORE=all 配置。这将指示 Amazon ECS 启动您指定的实例,并在每个实例上运行一个任务,同时自动将该加速器的所有资源分配给您的工作负载以实现最佳性能。

要开始使用 ECS 托管实例,请使用 AWS 管理控制台、Amazon ECS MCP 服务器或您最喜欢的基础设施即代码工具,在新的或现有的 Amazon ECS 集群中启用该功能。除了常规的 Amazon EC2 费用外,您还需为预置的计算资源支付管理费用。要了解有关 ECS 托管实例的更多信息,请访问功能页面文档AWS 新闻发布博客