Amazon EC2 P5e 執行個體已透過 EC2 容量區塊全面推出

張貼日期: 2024年9月9日

AWS 於今日宣布全面推出 Amazon Elastic Compute Cloud (Amazon EC2) P5e 執行個體,採用最新的 NVIDIA H200 Tensor Core GPU。這些執行個體透過 EC2 容量區塊推出,可在 Amazon EC2 中提供最高的效能,以進行深度學習與生成式 AI 推論。

您可以使用 Amazon EC2 P5e 執行個體來訓練及部署日趨複雜的大型語言模型 (LLM) 和擴散模型,為需求最嚴苛的生成式 AI 應用程式提供支援。您也可以使用 P5e 執行個體在製藥探索、地震分析、天氣預報和財務模型等領域,大規模部署需求嚴苛的 HPC 應用程式。

P5e 執行個體採用 8 個 H200 GPU,與 P5 執行個體中採用的 H100 GPU 相比,GPU 記憶體大小為 1.7 倍,GPU 記憶體頻寬為 1.5 倍。它們提供市場領先的擴展功能,用於分散式訓練和緊耦合的 HPC 工作負載,使用第二代 Elastic Fabric Adapter (EFA) 技術提供高達 3,200 Gbps 的網速。為了滿足客戶對於大規模但延遲性低的需求,已將 P5e 執行個體部署在 Amazon EC2 UltraCluster 中。

透過 ML 適用的 EC2 容量區塊,P5e 執行個體現已於美國東部 (俄亥俄) AWS 區域中推出,大小為 p5e.48xlarge。

若要進一步了解 P5e 執行個體,請參閱 Amazon EC2 P5e 執行個體