投稿日: Dec 21, 2023

本日、Open MPI 5.0 をサポートする Elastic Fabric Adapter (EFA) インストーラーの最新リリースを発表できることを嬉しく思います。

EFA は、高レベルのノード間通信を必要とするワークロード向けに、低レイテンシー、高帯域幅のネットワークインターフェイスを提供します。Open MPI 5.0 は、人気のあるオープンソースのメッセージパッシングインターフェイス (MPI) 実装の最新バージョンです。MPI 標準 4.0 との互換性が向上し、MPI セッション、階層的自律型 (HAN) コレクティブ、GPUDirect RDMA サポートなどの新機能が含まれています。

MPI セッションでは、MPI プロセス内の複数のライブラリが MPI API を呼び出すことができるため、ワールドコミュニケーターの初期化のボトルネックが解消されます。HAN コレクティブがデフォルトの MPI コレクティブとなり、全体的なレイテンシーと帯域幅が向上しました。Open MPI 5.0 では、ついにポイントツーポイント通信用の GPUDirect RDMA がサポートされるようになります。GPUDirect RDMA を使用すると、デベロッパーは CPU をバイパスし、NVIDIA GPU とその他の PCI-E デバイス (EFA など) 間でメモリを直接転送できます。ハイパフォーマンスコンピューティング (HPC) のデベロッパーは、NVIDIA A100 および H100 GPU を利用した Amazon EC2 インスタンスを活用して、EFA と Open MPI 5.0 を備えたクラウドに、高度にスケーラブルな HPC クラスターを構築できるようになります。 

Open MPI 5.0 が EFA インストーラー v1.30.0 の一部として利用できるようになりました。インストーラーを実行して Open MPI 5.0 モジュールを有効にするだけで開始できます。GPUDirect RDMA を使用したいデベロッパーは、Amazon EC2 P4 および P5 インスタンスでそれを実現できます。

EFA で Open MPI 5.0 を実行する方法の詳細を確認し、最新の EFA インストーラーをダウンロードしてください。