投稿日: Sep 28, 2023
深層学習とハイパフォーマンスコンピューティング (HPC) アプリケーション向けに Amazon EC2 で最高のパフォーマンスを発揮する Amazon EC2 P5 インスタンスが、米国東部 (オハイオ) リージョンで利用できるようになりました。
P5 インスタンスは、最も要求の厳しい生成 AI アプリケーションを強化する、ますます複雑化する大規模言語モデル (LLM) や拡散モデルのトレーニングやデプロイに使用できます。これには、質問への回答、コード生成、動画と画像の生成、音声認識などが含まれます。また、P5 インスタンスを使用して、医薬品開発、耐震解析、天気予報、財務モデリングなどの要求の厳しい HPC アプリケーションを大規模にデプロイすることもできます。
P5 インスタンスは、最新の NVIDIA H100 Tensor コア GPU を搭載しており、前世代の GPU ベースのインスタンスと比較して、2 倍の CPU パフォーマンス、2 倍のシステムメモリ、4 倍のローカルストレージを提供します。第 2 世代の Elastic Fabric Adapter (EFA) テクノロジーを使用した最大 3,200 Gbps のネットワーキングにより、分散型トレーニングや密結合された HPC ワークロード向けの、市場をリードするスケールアウト機能を提供します。低レイテンシーで大規模であるというお客様のニーズに対応するために、P5 インスタンスは Amazon EC2 UltraCluster にデプロイされ、最大 20,000 個の H100 GPU 間でペタビットスケールのノンブロッキング相互接続を提供します。
今回のリージョン拡大により、Amazon EC2 P5 インスタンスは米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでご利用いただけるようになりました。
P5 インスタンスの詳細については、「Amazon EC2 P5 Instances」を参照してください。