Amazon EC2 P5en インスタンスが米国東部 (バージニア北部) とアジアパシフィック (ジャカルタ) で利用可能に
本日より、NVIDIA H200 GPU を搭載した Amazon Elastic Compute Cloud (Amazon EC2) P5en インスタンスが米国東部 (バージニア北部) およびアジアパシフィック (ジャカルタ) リージョンで利用可能になりました。このインスタンスは、生成 AI およびハイパフォーマンスコンピューティング (HPC) アプリケーション向けに最適化されています。
P5en インスタンスには 8 個の H200 GPU が搭載されており、P5 インスタンスに搭載されている H100 GPU の 1.7 倍の GPU メモリサイズと 1.4 倍の GPU メモリ帯域幅を備えています。P5en インスタンスでは、H200 GPU を高性能のカスタム第 4 世代 インテル Xeon スケーラブルプロセッサと組み合わせて、CPU と GPU 間の Gen5 PCIe を実現しています。これにより、CPU と GPU 間の帯域幅が最大 4 倍になり、AI トレーニングと推論のパフォーマンスが向上します。P5en では、Nitro v5 を使用した第 3 世代の EFA が最大 3200 Gbps を発揮し、前世代の EFA と Nitro を使用する P5 と比較して、レイテンシーが最大 35% 改善しています。これにより、深層学習、生成 AI、リアルタイムデータ処理、ハイパフォーマンスコンピューティング (HPC) アプリケーションなどの分散トレーニングワークロードで集団通信のパフォーマンス向上に役立ちます。大きいスケールと低レイテンシーを求めるお客様のニーズに応えるため、P5en インスタンスは Amazon EC2 UltraClusters にデプロイされ、市場をリードするスケールアウト機能を分散トレーニングおよび密結合 HPC ワークロード向けに提供します。
今回のリージョンの追加によって、P5en インスタンスは、米国東部 (バージニア北部、オハイオ)、米国西部 (オレゴン)、欧州 (スペイン)、アジアパシフィック (ジャカルタ、ムンバイ、ソウル、東京) の AWS リージョンと、米国東部 (アトランタ) ローカルゾーン us-east-1-atl-2a で p5en.48xlarge サイズを利用できるようになりました。
P5en インスタンスの詳細については、「Amazon EC2 P5en インスタンス」を参照してください。