发布于: Nov 1, 2023

今天,AWS 宣布全面推出适用于机器学习的 Amazon Elastic Compute Cloud (Amazon EC2) 容量块。您可以使用 EC2 容量块在 Amazon EC2 UltraCluster 中预留 GPU 实例,以便将来根据运行机器学习 (ML) 工作负载所需的时间进行使用。这是一种预留容量的创新方式,您可以设置未来使用 GPU 实例的日期,但只能在您需要这些实例的时间内使用。 

EC2 容量块让您能够以一种可靠并且可预测的方式访问适用于机器学习工作负载的 GPU 实例。借助适用于机器学习的 EC2 容量块,您可以通过托管在 Amazon EC2 UltraCluster 中来获得低延迟、高吞吐量的连接,用于分布式训练。您可以将 GPU 容量预留 1 到 14 天,集群大小为 1 到 64 个实例(512 个 GPU),让您能够灵活地运行各种机器学习工作负载。这包括训练和优化机器学习模型、快速原型设计以及应对未来需求的激增。EC2 容量块最多可以提前八周预留。

EC2 容量块现在支持在美国东部(俄亥俄州)AWS 区域预留亚马逊 EC2 P5 实例,该实例由最新的 NVIDIA H100 Tensor Core GPU 提供支持。

要开始使用,请访问 AWS 管理控制台AWS 命令行界面 (AWS CLI) 和 AWS SDK。要了解更多信息,请参阅适用于机器学习的 Amazon EC2 容量块文档