生成 AI と HPC 向けに最適化された Amazon EC2 P5en インスタンスの一般提供を開始

投稿日: 2024年12月2日

本日、AWS は、最新の NVIDIA H200 Tensor コア GPU を搭載した Amazon Elastic Compute Cloud (Amazon EC2) P5en インスタンスの一般提供を開始しました。これらのインスタンスは、深層学習アプリケーションやハイパフォーマンスコンピューティング (HPC) アプリケーション向けに Amazon EC2 で最高のパフォーマンスを発揮します。

Amazon EC2 P5en インスタンスは、最も要求の厳しい生成 AI アプリケーションを強化する、ますます複雑化する大規模言語モデル (LLM) や拡散モデルのトレーニングとデプロイに使用できます。また、P5en インスタンスを使用して、医薬品開発、耐震解析、天気予報、財務モデリングなどの要求の厳しい HPC アプリケーションを大規模にデプロイすることもできます。

P5en インスタンスには最大 8 個の H200 GPU が搭載されており、P5 インスタンスに搭載されている H100 GPU と比較して、GPU メモリのサイズは 1.7 倍、GPU メモリの帯域幅は 1.5 倍です。P5en インスタンスでは、H200 GPU を高性能のカスタム第 4 世代 インテル Xeon スケーラブルプロセッサと組み合わせて、CPU と GPU 間の Gen5 PCIe を実現しています。これにより、CPU と GPU 間の帯域幅が最大 4 倍になり、AI トレーニングと推論のパフォーマンスが向上します。P5en では、Nitro v5 を使用した第 3 世代の EFA が最大 3200 Gbps を発揮し、前世代の EFA と Nitro を使用する P5 と比較して、レイテンシーが最大 35% 改善しています。これにより、深層学習、生成 AI、リアルタイムデータ処理、ハイパフォーマンスコンピューティング (HPC) アプリケーションなどの分散トレーニングワークロードで集団通信のパフォーマンス向上に役立ちます。大きいスケールと低レイテンシーを求めるお客様のニーズに応えるため、P5en インスタンスは Amazon EC2 UltraClusters にデプロイされ、市場をリードするスケールアウト機能を分散トレーニングおよび密結合 HPC ワークロード向けに提供します。

P5en インスタンスは、米国東部 (オハイオ)、米国西部 (オレゴン)、アジアパシフィック (東京) の AWS リージョンと、米国東部 (アトランタ) ローカルゾーン us-east-1-atl-2a において、p5en.48xlarge サイズでご利用いただけるようになりました。

P5en インスタンスの詳細については、「Amazon EC2 P5en インスタンス」を参照してください。