Amazon EC2 P5en 執行個體現已在美國東部 (維吉尼亞北部) 和亞太區域 (雅加達) 推出

張貼日期: 2025年3月27日

即日起,搭載 NVIDIA H200 GPU 的 Amazon Elastic Compute Cloud (Amazon EC2) P5en 執行個體已適用於美國東部 (維吉尼亞北部) 和亞太區域 (雅加達)。這些執行個體已針對生成式 AI 和高效能運算 (HPC) 應用程式進行最佳化。

P5en 執行個體採用 8 個 H200 GPU,與 P5 執行個體中採用的 H100 GPU 相比,其 GPU 記憶體大小為 1.7 倍,GPU 記憶體頻寬則為 1.4 倍。P5en 執行個體將 H200 GPU 與高效能客製化第 4 代 Intel Xeon 可擴充處理器配對,在 CPU 與 GPU 之間啟用 Gen5 PCIe,並在 CPU 和 GPU 之間提供高達 4 倍的頻寬,而且提高 AI 訓練和推論效能。P5en 具有高達 3200 Gbps 的第三代 EFA (使用 Nitro v5),與使用上一代 EFA 和 Nitro 的 P5 相比,延遲提高了 35%。這有助於提升分散式訓練工作負載的集體通訊效能,例如深度學習、生成式 AI、即時資料處理和高效能運算 (HPC) 應用程式。為了滿足客戶大規模低延遲的需求,P5en 執行個體部署在 Amazon EC2 UltraCluster 中,並為分散式訓練和緊密耦合的 HPC 工作負載提供市場領先的橫向擴展功能。

有了這些額外區域,P5en 執行個體現在適用於美國東部 (維吉尼亞北部、俄亥俄)、美國西部 (奧勒岡)、歐洲 (西班牙) 和亞太區域 (雅加達、孟買、首爾、東京和首爾) AWS 區域,以及美國東部 (亞特蘭大) 本地區域 us-east-1-atl-2a,大小為 p5en.48xlarge。

若要進一步了解 P5en 執行個體,請參閱 Amazon EC2 P5en 執行個體