针对生成式人工智能和 HPC 进行了优化的 Amazon EC2 P5en 实例现已全面推出

发布于: 2024年12月2日

今天，AWS 宣布全面推出 Amazon Elastic Compute Cloud（Amazon EC2）P5en 实例，该实例由最新的 NVIDIA H200 Tensor Core GPU 提供支持。这些实例在 Amazon EC2 中为深度学习和高性能计算 (HPC) 应用程序提供了最高的性能。

您可以使用 Amazon EC2 P5en 实例来训练和部署日益复杂的大型语言模型（LLM）和扩散模型，为要求最苛刻的生成式人工智能应用程序提供支持。您还可以使用 P5en 实例在医药研发、地震分析、气象预报和财务建模等领域大规模部署要求苛刻的 HPC 应用程序。

P5en 实例采用多达 8 个 H200 GPU，其 GPU 内存大小和 GPU 内存带宽分别是 P5 实例采用的 H100 GPU 的 1.7 倍和 1.5 倍。P5en 实例将 H200 GPU 与高性能的第四代定制 Intel Xeon 可扩展处理器搭配，支持 CPU 和 GPU 之间的 Gen5 PCIe，提供高达 4 倍的带宽，从而提高人工智能的训练和推理性能。与使用上一代 EFA 和 Nitro 的 P5 相比，P5en 采用 Nitro v5 和高达 3200 Gbps 的第三代 EFA，将延迟降低了 35%。这有助于提高分布式训练工作负载的集体通信性能，如深度学习、生成式人工智能、实时数据处理和高性能计算（HPC）应用程序。为了满足客户对大规模低延迟的需求，P5en 实例部署在 Amazon EC2 UltraClusters 中，为分布式训练和紧密耦合的 HPC 工作负载提供市场领先的扩展能力。

P5en 实例现已在美国东部（俄亥俄州）、美国西部（俄勒冈州）和亚太地区（东京）AWS 区域以及美国东部（亚特兰大）本地区域 us-east-1-atl-2a 推出，大小为 p5en.48xlarge。

要了解有关 P5en 实例的更多信息，请参阅 Amazon EC2 P5en 实例。

选择您的 Cookie 首选项

针对生成式人工智能和 HPC 进行了优化的 Amazon EC2 P5en 实例现已全面推出

终止对 Internet Explorer 的支持