Amazon Web Services ブログ
第 2 世代 FPGA 搭載の Amazon EC2 インスタンス (F2) が使用可能に
最大 8 個の AMD FPGA、最大 192 コアの AMD EPYC (Milan) プロセッサ、高帯域幅メモリ (HBM)、最大 8 TiB の SSD ベースのインスタンスストレージ、最大 2 TiB のメモリを搭載した F2 インスタンスは、2 つのサイズからお選びいただけます。このインスタンスを使用すると、ゲノミクス、マルチメディア処理、ビッグデータ、衛星通信、ネットワーキング、シリコンシミュレーション、ライブ動画ワークロードを加速できます。
FPGA の簡単なまとめ
FPGA を搭載した第 1 世代の Amazon Elastic Compute Cloud (Amazon EC2) インスタンスをプレビューしたとき、FPGA モデルについて、次のように説明しました
カスタムかつハードウェアベースのソリューションへの興味深いルートの 1 つは、Field Programmable Gate Array (FPGA) として知られています。1 つの機能を念頭に置いて設計された専用チップとは対照的に、FPGA はより柔軟です。PC ボードのソケットに差し込んだ後、現場でプログラミングできます。各 FPGA には、固定かつ有限数のシンプルなロジックゲートが含まれています。FPGA のプログラミングでは、それらを接続して目的の論理関数 (AND、OR、XOR など) またはストレージ要素 (フリップフロップとシフトレジスタ) を作成するだけです。基本的にシリアル (いくつかの並列要素を含む) で、固定サイズの指示とデータパス (通常は 32 ビットまたは 64 ビット) を備えた CPU とは異なり、FPGA は多くの演算を並行して実行するようにプログラミングすることが可能で、演算自体の幅の広狭にはほぼ制限がありません。
リリース以来、AWS のお客様は F1 インスタンスを利用して、さまざまな種類のアプリケーションやサービスをホストしてきました。より新しい FPGA、より高い処理能力、より多くのメモリ帯域幅を備えた新しい F2 インスタンスは、高度な並列化が可能で、コンピューティング負荷が高いワークロードのホストとしてより優れています。
AMD Virtex UltraScale+ HBM VU47P FPGA には、それぞれ 285 万個のシステムロジックセルと、9,024 個の DSP スライス (INT8 値の処理時に最大 28 TOPS の DSP コンピューティングパフォーマンス) が搭載されています。各 F2 インスタンスに関連付けられた FPGA アクセラレータカードは、FPGA あたり 16 GiB の高帯域幅メモリと 64 GiB の DDR4 メモリを提供します。
F2 の内部
F2 インスタンスは、第 3 世代 AMD EPYC (Milan) プロセッサを搭載しています。F1 インスタンスと比較すると、プロセッサコア数は最大 3 倍、システムメモリと NVMe ストレージは最大 2 倍、ネットワーク帯域幅は最大 4 倍です。各 FPGA には、最大 460 GiB/ 秒の帯域幅を備えた 16 GiB の高帯域幅メモリ (HBM) が搭載されています。インスタンスサイズと仕様については、こちらをご覧ください。
インスタンス名 | vCPU |
FPGA |
FPGA メモリ HBM/DDR4 |
インスタンスメモリ |
NVMe ストレージ |
EBS 帯域幅 |
ネットワーク帯域幅 |
f2.12xlarge | 48 | 2 | 32 GiB/ 128 GiB |
512 GiB | 1900 GiB (2x 950 GiB) |
15 Gbps | 25 Gbps |
f2.48xlarge | 192 | 8 | 128 GiB/ 512 GiB |
2,048 GiB | 7600 GiB (8x 950 GiB) |
60 Gbps | 100 Gbps |
ハイエンドの f2.48xlarge インスタンスは AWS Cloud Digital Interface (CDI) をサポートしているため、非圧縮のライブ動画をアプリケーション間で確実に転送できます。インスタンス間のレイテンシーは 8 ミリ秒と低くなります。
FPGA アプリケーションの構築
AWS EC2 FPGA Development Kit には、ハードウェアアクセラレーション FPGA アプリケーションの開発、シミュレーション、デバッグ、コンパイル、実行に使用するツールが含まれています。キットの FPGA Developer AMI をメモリ最適化インスタンスまたはコンピューティング最適化インスタンスで起動して開発とシミュレーションを行い、F2 インスタンスを使用して最終的なデバッグとテストを行うことができます。
開発者キットに含まれるツールは、さまざまな開発パラダイム、ツール、アクセラレータ言語、デバッグオプションをサポートしています。いずれを選択しても、最終的にはカスタムアクセラレーションロジックと、FPGA メモリ、PCIe バス、割り込み、外部周辺機器へのアクセスを実装する AWS Shell を含む Amazon FPGA Image (AFI) を作成できます。AFI は、必要な数の F2 インスタンスにデプロイしたり、他の AWS アカウントと共有したり、AWS Marketplace で公開したりできます。
F1 インスタンスで実行するアプリケーションを既に作成している場合は、最新の AMD ツールを使用するように開発環境を更新し、F2 インスタンスにアップグレードする前に再構築して検証する必要があります。
稼働中の FPGA インスタンス
F1 インスタンスと F2 インスタンスがユニークかつ極めて要求の厳しいワークロードをどのようにサポートできるかを示す、優れた例をいくつか示します。
ゲノミクス – 多国籍の製薬およびバイオテクノロジー企業である AstraZeneca は、数千の F1 インスタンスを使用して世界最速のゲノミクスパイプラインを構築しました。このパイプラインでは、2 か月以内に 40 万を超える全ゲノムサンプルを処理できます。F2 で Illumina DRAGEN を採用すると、より低コストでより優れたパフォーマンスを実現すると同時に、疾患の発見、診断、治療を加速することができます。
衛星通信 – 衛星通信事業者は、柔軟性がなく高価な物理インフラストラクチャ (変調器、復調器、コンバイナ、スプリッタなど) から、アジャイルかつソフトウェア定義の FPGA 搭載ソリューションに移行しています。FPGA のデジタルシグナルプロセッサ (DSP) 要素を使用することで、これらのソリューションを現場で再設定して、新しい波形に対応したり、変化する要件に対応したりすることができます。インスタンスあたり最大 8 個の FPGA のサポート、十分なネットワーク帯域幅、仮想イーサネットを使用した Data Plan Development Kit (DPDK) のサポートなど、F2 の主要な機能を使用して、複数の複雑な波形の並列処理をサポートできます。
分析 – NeuroBlade の SQL プロセッシングユニット (SPU) は、Presto、Apache Spark、およびその他のオープンソースのクエリエンジンと統合され、F2 インスタンスで実行した場合、より高速なクエリ処理と市場をリードするクエリスループット効率を実現します。
知っておくべきこと
これらの F2 インスタンスについて知っておくべきことがいくつかあります。
リージョン – F2 インスタンスは、現在米国東部 (バージニア北部) と欧州 (ロンドン) の AWS リージョンで利用可能です。今後、他のリージョンでも利用可能になる予定です。
オペレーティングシステム – F2 インスタンスは Linux 専用です。
購入オプション – F2 インスタンスは、オンデマンド、スポット、Savings Plan、ハードウェア専有インスタンス、専有ホストの形式で使用できます。
– Jeff;
原文はこちらです。