投稿日: Nov 2, 2020
Amazon EC2 P4d インスタンスがご利用いただけるようになったことをお知らせします。これは次世代の GPU ベースのインスタンスで、自然言語処理、オブジェクトの検出と分類、地震解析、およびゲノミクス研究などのアプリケーション向けに、クラウドの機械学習 (ML) トレーニングとハイパフォーマンスコンピューティング (HPC) で最高のパフォーマンスを実現します。P4d インスタンスは、最新の NVIDIA A100 Tensor Core GPU を搭載しており、Elastic Fabric Adapter (EFA) と NVIDIA GPUDirect RDMA (リモートダイレクトメモリアクセス) をサポートする 400 Gbps インスタンスネットワーキングをクラウドで初めて提供します。これにより、マルチノード ML トレーニングと HPC ワークロードを効率的にスケールアウトできるようになります。
P4d インスタンスは、前世代の P3 インスタンスと比較して、2.5 倍のメモリ、倍精度浮動小数点パフォーマンス、16 倍のネットワーク帯域幅、4 倍のローカル NVMe ベースの SSD ストレージで、トレーニングのコストを最大 60% 削減し、2.5 倍以上の深層学習パフォーマンスを実現します。
P4d インスタンスは、EC2 UltraClusters と呼ばれるハイパースケールクラスターにデプロイされ、4,000 を超える NVIDIA A100 GPU、ペタビットスケールのノンブロッキングネットワーキングインフラストラクチャ、および FSx for Lustre による高スループットで低レイテンシーのストレージを提供します。このような EC2 UltraClusters は、世界トップクラスのスーパーコンピューターの 1 つで、セットアップやメンテナンスのコストをかけずに、デベロッパー、データサイエンティスト、研究者が日常的にスーパーコンピューティングにアクセスできるようにします。このような EC2 UltraCluster を使用すると、デベロッパーはマルチノード ML トレーニングまたは HPC アプリケーションを数千の GPU にスケーリングして最も複雑な問題を解決したり、少数のインスタンスにスケールダウンして、使用するインスタンスに対してのみ料金を支払うようにしたりできます。
Amazon EC2 P4d インスタンスは、AWS Nitro システム上に構築されています。このシステムは、分離されたマルチテナント、プライベートネットワーキング、高速ローカルストレージを備えた効率的で柔軟かつ安全なクラウドサービスの提供を可能にする AWS 設計のハードウェアとソフトウェアのイノベーションを集結させたものです。
P4d インスタンスは、AWS 米国東部 (バージニア北部) および米国西部 (オレゴン) リージョンでご利用いただけるようになりました。同インスタンスは p4d.24xl サイズで利用でき、96 個の vCPU、8 個の NVIDIA A100 GPU、1.1 TB のインスタンスメモリ、8 TB のローカル NVMe ベースの SSD ストレージ、EFA および GPUDirect RDMA による 400Gbps のネットワーク帯域幅、および 19Gbps の EBS バースト帯域幅を提供します。P4d インスタンスは、オンデマンドで、Savings Plans の一部として、リザーブドインスタンスとして、またはスポットインスタンスとしてご購入いただけます。
Amazon SageMaker、Amazon Elastic Kubernetes Service (EKS)、Amazon Elastic Container Service (ECS)、AWS ParallelCluster、AWS Batch などの ML およびオーケストレーション向けの人気のある AWS のサービスは、今後数週間以内に P4d インスタンスのサポートを追加で提供開始する予定です。Toyota Research Institute、GE Healthcare、Aon PathWise などの Fortune 500 企業から新興企業までの顧客がプレビュープログラムに参加し、P4d インスタンスを採用して、トレーニングの時間を短縮し、ML モデルのトレーニングのコストを削減しています。AWS マネジメントコンソール、AWS コマンドラインインターフェイス (CLI)、および AWS SDK を使用して、すぐに Amazon EC2 P4d インスタンスを開始しましょう。詳細については、製品概要ページまたは製品詳細ページをご覧ください。