Amazon FSx for Lustre が Elastic Fabric Adapter と NVIDIA GPUDirect Storage のサポートを開始
コンピューティングワークロード向けに高性能で費用対効果が高くスケーラブルなファイルストレージを提供するサービスである Amazon FSx for Lustre は、Elastic Fabric Adapter (EFA) と NVIDIA GPUDirect Storage (GDS) をサポートするようになりました。今回のリリースにより、Amazon FSx for Lustre はクラウド内の GPU インスタンスに対する最速のストレージパフォーマンスを提供し、以前の FSx for Lustre システムと比較して、クライアントインスタンスあたりのスループットが最大 12 倍向上しました (1200 Gbps)。これにより、機械学習トレーニングジョブをより迅速に完了し、ワークロードコストを削減できます。
EFA は、AWS Scalable Reliable Datagram (SRD) プロトコルを使用してネットワークスループットの使用率を高め、データ転送中にオペレーティングシステムをバイパスすることで、ワークロードのパフォーマンスを向上させます。Trn1 や HPC7a などの高性能コンピューティングインスタンスにより稼働するアプリケーションでは、EFA を使用してクライアントインスタンスあたりのスループットを向上させることができます。GDS サポートは EFA に基づいて構築されており、ファイルシステムと GPU メモリ間の直接データ転送を可能にすることで、パフォーマンスをさらに強化します。このダイレクトパスにより、データ転送操作におけるメモリコピーや CPU の関与を排除します。EFA と GDS のサポートを組み合わせることで、P5 GPU インスタンスと NVIDIA Compute Unified Device Architecture (CUDA) を使用するアプリケーションでは、クライアントインスタンスあたり最大 12 倍のスループット (最大 1200 Gbps) を実現できます。
EFA と GDS のサポートは、Persistent-2 ファイルシステムが利用可能なすべての商用 AWS リージョンの新しい FSx for Lustre Persistent-2 ファイルシステムで追加費用なしで利用できます。この新機能の詳細については、Amazon FSx for Lustre のドキュメントと AWS ニュースブログ「Amazon FSx for Lustre が GPU インスタンスへのスループットを最大 12 倍向上」をご覧ください。