针对生成式人工智能和 HPC 进行了优化的 Amazon EC2 P5en 实例现已全面推出

发布于: 2024年12月2日

今天,AWS 宣布全面推出 Amazon Elastic Compute Cloud(Amazon EC2)P5en 实例,该实例由最新的 NVIDIA H200 Tensor Core GPU 提供支持。这些实例在 Amazon EC2 中为深度学习和高性能计算 (HPC) 应用程序提供了最高的性能。

您可以使用 Amazon EC2 P5en 实例来训练和部署日益复杂的大型语言模型(LLM)和扩散模型,为要求最苛刻的生成式人工智能应用程序提供支持。您还可以使用 P5en 实例在医药研发、地震分析、气象预报和财务建模等领域大规模部署要求苛刻的 HPC 应用程序。

P5en 实例采用多达 8 个 H200 GPU,其 GPU 内存大小和 GPU 内存带宽分别是 P5 实例采用的 H100 GPU 的 1.7 倍和 1.5 倍。P5en 实例将 H200 GPU 与高性能的第四代定制 Intel Xeon 可扩展处理器搭配,支持 CPU 和 GPU 之间的 Gen5 PCIe,提供高达 4 倍的带宽,从而提高人工智能的训练和推理性能。与使用上一代 EFA 和 Nitro 的 P5 相比,P5en 采用 Nitro v5 和高达 3200 Gbps 的第三代 EFA,将延迟降低了 35%。这有助于提高分布式训练工作负载的集体通信性能,如深度学习、生成式人工智能、实时数据处理和高性能计算(HPC)应用程序。为了满足客户对大规模低延迟的需求,P5en 实例部署在 Amazon EC2 UltraClusters 中,为分布式训练和紧密耦合的 HPC 工作负载提供市场领先的扩展能力。

P5en 实例现已在美国东部(俄亥俄州)、美国西部(俄勒冈州)和亚太地区(东京)AWS 区域以及美国东部(亚特兰大)本地区域 us-east-1-atl-2a 推出,大小为 p5en.48xlarge。

要了解有关 P5en 实例的更多信息,请参阅 Amazon EC2 P5en 实例。