针对生成式人工智能和 HPC 进行了优化的 Amazon EC2 P5en 实例现已全面推出
今天,AWS 宣布全面推出 Amazon Elastic Compute Cloud(Amazon EC2)P5en 实例,该实例由最新的 NVIDIA H200 Tensor Core GPU 提供支持。这些实例在 Amazon EC2 中为深度学习和高性能计算 (HPC) 应用程序提供了最高的性能。
您可以使用 Amazon EC2 P5en 实例来训练和部署日益复杂的大型语言模型(LLM)和扩散模型,为要求最苛刻的生成式人工智能应用程序提供支持。您还可以使用 P5en 实例在医药研发、地震分析、气象预报和财务建模等领域大规模部署要求苛刻的 HPC 应用程序。
P5en 实例采用多达 8 个 H200 GPU,其 GPU 内存大小和 GPU 内存带宽分别是 P5 实例采用的 H100 GPU 的 1.7 倍和 1.5 倍。P5en 实例将 H200 GPU 与高性能的第四代定制 Intel Xeon 可扩展处理器搭配,支持 CPU 和 GPU 之间的 Gen5 PCIe,提供高达 4 倍的带宽,从而提高人工智能的训练和推理性能。与使用上一代 EFA 和 Nitro 的 P5 相比,P5en 采用 Nitro v5 和高达 3200 Gbps 的第三代 EFA,将延迟降低了 35%。这有助于提高分布式训练工作负载的集体通信性能,如深度学习、生成式人工智能、实时数据处理和高性能计算(HPC)应用程序。为了满足客户对大规模低延迟的需求,P5en 实例部署在 Amazon EC2 UltraClusters 中,为分布式训练和紧密耦合的 HPC 工作负载提供市场领先的扩展能力。
P5en 实例现已在美国东部(俄亥俄州)、美国西部(俄勒冈州)和亚太地区(东京)AWS 区域以及美国东部(亚特兰大)本地区域 us-east-1-atl-2a 推出,大小为 p5en.48xlarge。
要了解有关 P5en 实例的更多信息,请参阅 Amazon EC2 P5en 实例。