針對生成式 AI 和 HPC 進行最佳化的 Amazon EC2 P5en 執行個體現已正式上市
今天,AWS 宣佈全面推出 Amazon Elastic Compute Cloud (Amazon EC2) P5en 執行個體,採用最新的 NVIDIA H200 Tensor Core GPU。這些執行個體為深度學習和高效能運算 (HPC) 應用程式提供 Amazon EC2 的最高效能。
您可以使用 Amazon EC2 P5en 執行個體來訓練及部署日趨複雜的大型語言模型 (LLM) 與擴散模型,為需求最嚴苛的生成式 AI 應用程式提供支援。您也可以使用 P5en 執行個體在製藥探索、地震分析、天氣預報及財務模型等領域,大規模部署需求嚴苛的 HPC 應用程式。
P5en 執行個體採用多達 8 個 H200 GPU,與 P5 執行個體中採用的 H100 GPU 相比,其 GPU 記憶體大小為 1.7 倍,GPU 記憶體頻寬則為 1.5 倍。P5en 執行個體將 H200 GPU 與高效能客製化第 4 代 Intel Xeon 可擴充處理器配對,在 CPU 與 GPU 之間啟用 Gen5 PCIe,並在 CPU 和 GPU 之間提供高達 4 倍的頻寬,而且提高 AI 訓練和推論效能。P5en 具有高達 3200 Gbps 的第三代 EFA (使用 Nitro v5),與使用上一代 EFA 和 Nitro 的 P5 相比,延遲提高了 35%。這有助於提升分散式訓練工作負載的集體通訊效能,例如深度學習、生成式 AI、即時資料處理和高效能運算 (HPC) 應用程式。為了滿足客戶大規模低延遲的需求,P5en 執行個體部署在 Amazon EC2 UltraCluster 中,並為分散式訓練和緊密耦合的 HPC 工作負載提供市場領先的橫向擴展功能。
P5en 執行個體現已在美國東部 (俄亥俄)、美國西部 (奧勒岡) 和亞太地區 (東京) AWS 區域以及美國東部 (亞特蘭大) 本機區域 us-east-1-atl-2a 推出,大小為 p5en.48xlarge。
若要進一步了解 P5en 執行個體,請參閱 Amazon EC2 P5en 執行個體。