发布于: Dec 21, 2023

今天,我们很高兴地宣布推出支持 Open MPI 5.0 的 Elastic Fabric Adapter (EFA) 安装程序的最新版本。

EFA 为需要高级别节点间通信的工作负载提供低延迟、高带宽的网络接口。Open MPI 5.0 是热门的开源消息传递接口 (MPI) 实现的最新版本,其中包括与 MPI Standard 4.0 改进的兼容性,以及 MPI 会话、分层自动调谐 (HAN) 集合和 GPUDirect RDMA 支持等新功能。

MPI 会话允许 MPI 进程中的多个库调用 MPI API,并消除了全球通信工具初始化的瓶颈。HAN 集合现在是默认 MPI 集合,用于改善整体延迟和带宽。最后,Open MPI 5.0 现在支持使用 GPUDirect RDMA 进行点对点通信。GPUDirect RDMA 允许开发人员绕过 CPU,直接在 NVIDIA GPU 和其他 PCI-E 设备(例如 EFA)之间传输内存。高性能计算 (HPC) 开发人员现在可以利用由 NVIDIA A100 和 H100 GPU 提供支持的 Amazon EC2 实例,使用 EFA 和 Open MPI 5.0 在云中构建高度可扩展的 HPC 集群。 

Open MPI 5.0 现在作为 EFA 安装程序 v1.30.0 的一部分提供。只需运行安装程序并启用 Open MPI 5.0 模块即可开始使用。想要使用 GPUDirect RDMA 的开发人员可以在 Amazon EC2 P4 和 P5 实例上执行此操作。

了解有关使用 EFA 运行 Open MPI 5.0 的更多信息,并下载最新的 EFA 安装程序