投稿日: Jul 19, 2019
Elastic Fabric Adapter (EFA) プロバイダーが、Libfabric 1.8 リリースに正式に統合されます。お客様は、EFA プロバイダーを別途インストールせずに、Libfabric 1.8 をそのまま使用できます。
EFA は、AWS 上での大規模なノード間通信を高いレベルで必要とするようなアプリケーションの実行を可能にする、Amazon EC2 インスタンスのためのネットワークインターフェイスです。EFA を使用すると、Message Passing Interface (MPI) を使用する高性能計算 (HPC) アプリケーションおよび NVIDIA Collective Communications Library (NCCL) を使用する Machine Learning (ML) アプリケーションを、数千の CPU や GPU にスケールできます。
Libfabric ライブラリは、EFA ハードウェアへのアクセス向けの推奨インタフェースです。Libfabric は OpenFabrics Interface (OFI) のコアコンポーネントであり、OFI のユーザースペース API を定義およびエクスポートするライブラリです。Libfabric は一般的に、アプリケーションが直接扱う唯一のソフトウェアです。
EFA の詳細については、EFA のドキュメントをご覧ください。EFA で HPC クラスターを起動するには、こちらで確認してください。