Amazon Web Services ブログ

ハイパフォーマンスコンピューティング向けに最適化された Amazon EC2 HPC6a インスタンス

ハイパフォーマンスコンピューティング (HPC) により科学者やエンジニアは、数値流体力学 (CFD)、天気予報、ゲノミクスなど、複雑で計算負荷の高い問題を解決できます。HPC アプリケーションでは通常、高いメモリ帯域幅、低レイテンシー、高帯域幅のネットワーク相互接続、高速並列ファイルシステムへのアクセスを備えたインスタンスが必要です。

多くのお客様が HPC ワークロードを実行するために AWS を利用しています。例えば、Descartes Labs は AWS を使用して TOP500 LINPACK ベンチマーク (市販されている最も強力なコンピュータシステム) の実行を強化し、1.93 PFLOPS を実現し、2019 年 6 月に TOP500 リストの 136 位にランクインしました。この実行では、Amazon EC2 C5 インスタンスのクラスターで 41,472 コアが使用されました。昨年、Descartes Labs は LINPACK ベンチマークを再実行し、EC2 インスタンスのクラスターで 172,692 コアで 2021 年 6 月の TOP500 リストの上位 40 位に入りました。これは、わずか 2 年間でパフォーマンスが 417% 向上したことを示しています。

AWS では、HPC をクラウドで実行し、ほとんどのオンプレミス環境では実用的でない何万もの並列タスクにスケーリングすることで、調査のスピードを上げ、結果を得るまでの時間を短縮できます。AWS は、 CPU、 GPU、 FPGA インスタンスをオンデマンドで提供し、 Elastic Fabric Adapter (EFA)、スループットを向上させ、密結合されたワークロードをスケーリングする EC2 ネットワークデバイス、AWS ParallelCluster は、AWS で HPC クラスターを簡単にデプロイおよび管理できるようにするオープンソースのクラスター管理ツールです。

HPC ワークロード用の EC2 HPC6a インスタンスの発表
今日、さまざまな業界のお客様が、コンピューティング最適化された EFA 対応の Amazon EC2 インスタンス(C5n、R5n、M5n M5zN など)を使用して、さまざまな HPC ワークロードのパフォーマンスを最大化していますが、これらのワークロードに何万ものコアがあると、コスト効率がますます重要になります。お客様が HPC ワークロードのパフォーマンスを最適化するだけではなく、コストも最適化したいと考えていることがわかりました。

2021 年 11 月に事前発表したとおり、HPC に最適化された新しい EC2 インスタンスである HPC6a が本日より一般公開されます。このインスタンスは、384 GB RAM を搭載した 96 個の第 3 世代 AMD EPYC™ プロセッサ (ミラノ) コアを搭載した EFA を通じて 100 Gbps のネットワーキングを実現し、同等の x86 ベースのコンピューティング最適化インスタンスに比べて最大 65% 優れたコストパフォーマンスを提供します。

HPC6a インスタンスは、米国東部 (オハイオ) リージョンおよび GovCloud (米国西部) リージョンで、オンデマンドおよび Dedicated Hosting (Savings Plans) の一環として、今すぐ起動できます。手順の詳細は以下のとおりです。

インスタンス名 CPU RAM EFAネットワーク帯域幅 アタッチされたストレージ
hpc6a.48xlarge 96 384 GiB 最大 100 Gbps EBS のみ

*HPC6a インスタンスでは、HPC コードを最適化するために、同時マルチスレッドが無効になっています。つまり、他の EC2 インスタンスとは異なり、HPC6a vCPU はスレッドではなく物理コアです。

HPC ワークロードの予測可能なスレッドパフォーマンスと効率的なスケジューリングを可能にするために、同時マルチスレッドは無効になっています。AWS Nitro System のおかげで、ハイパーバイザーのコアが抑制されることはなく、すべてのコアをコードで使用できるようになります。

HPC6a インスタンスでは、高レベルのインスタンス間通信に依存する密結合の HPC ワークロードを実行しているお客様に、コストとパフォーマンスの最適化を実現するために、対象を絞った多数の機能が導入されています。これらのインスタンスは 100 Gbps の EFA ネットワーク帯域幅を実現し、1 つのアベイラビリティーゾーン内で密結合された大規模なクラスターを効率的にスケーリングするように設計されています。

自動車業界をはじめとする多くのエンジニアリングのお客様からは、物理試験の必要性を減らし、ますます仮想化されたシミュレーションベースの製品設計プロセスをより早く、より低コストで進めたいとお考えの声が寄せられています。

シーメンス Simcenter STAR-CCM+ 車載 CFD シミュレーションのベンチマーク結果によると、HPC6a が EFAネットワーキングを利用して最大 400 ノード (約 40,000 コア) まで拡張すると、約 100% のスケーリング効率を維持できます。HPC6a インスタンスは、c5n と比較して 70% 低いコストを示しています。つまり、HPC6a インスタンスを使用すれば、企業は新しいデザインをより早く、より低コストで提供できます。つまり、HPC6a インスタンスを使用すれば、企業は新しい設計をより早く、より低コストで提供できるようになります。

HPC6a インスタンスを AMD EPYC 第 3 世代 (ミラノ) プロセッサとともに使用すると、最大かつ最も複雑な HPC シミュレーションを EC2 で実行し、コストとパフォーマンスを最適化できます。また、新しい HPC6a インスタンスを AWS BatchAWS ParallelCluster とともに使用して、ワークロードの送信とクラスターの作成を簡素化することもできます。

詳細については、 HPC6a インスタンスページにアクセスし、 HPC チームAWS re: Post for EC2、または通常の AWS Support 連絡先を通じてお問い合わせください。

Channy

原文はこちらです。