发布于: Jul 19, 2019

Elastic Fabric Adapter (EFA) 提供程序正式集成到Libfabric 1.8 版本中。客户可以直接使用 Libfabric 1.8,无需单独安装 EFA 提供程序。

EFA 是 Amazon EC2 实例的网络接口,使客户能够在 AWS 上大规模运行需要高级别节点间通信的应用程序。借助 EFA,使用消息传递接口 (MPI) 的高性能计算 (HPC) 应用程序和使用 NVIDIA 多节点协同通信库 (NCCL) 的 Machine Learning (ML) 应用程序可以扩展到数千个 CPU 或 GPU。  

Libfabric 库是访问 EFA 硬件的首选接口。Libfabric 是 OpenFabrics Interfaces (OFI) 的核心组件,也是用于定义和导出 OFI 用户空间 API 的库。它通常是应用程序直接处理的唯一软件。 

要了解有关 EFA 的更多信息,请参阅 EFA 文档。要启动带有 EFA 的 HPC 集群,请查看此处。