Publicado: Dec 21, 2023

Hoje, temos o prazer de anunciar a versão mais recente do instalador do Elastic Fabric Adapter (EFA) com suporte para Open MPI 5.0.

O EFA oferece uma interface de rede de baixa latência e alta largura de banda para workloads que exigem um alto nível de comunicação entre os nós. O Open MPI 5.0 é a versão mais recente da popular implementação da Interface de Passagem de Mensagens (MPI) de código aberto que inclui compatibilidade aprimorada com a MPI Standard 4.0 e novos recursos, como sessões de MPI, coletivos Hierarchical AutotuNed (HAN) e suporte ao RDMA da GPUDirect.

As sessões de MPI permitem que várias bibliotecas em um processo de MPI chamem as APIs de MPI e eliminam o gargalo da inicialização do comunicador mundial. Agora, os coletivos HAN agora são os coletivos MPI padrão para melhorar a latência e a largura de banda gerais. Finalmente, o Open MPI 5.0 já oferece suporte ao RDMA da GPUDirect para comunicações ponto a ponto. A RDMA da GPUDirect permite que os desenvolvedores ignorem a CPU e transfiram memória diretamente entre as GPUs NVIDIA e outros dispositivos PCI-E, como o EFA. Agora, os desenvolvedores de computação de alta performance (HPC) podem usar instâncias do Amazon EC2 baseadas em GPUs NVIDIA A100 e H100 para criar clusters de HPC altamente escaláveis na nuvem com EFA e Open MPI 5.0. 

O Open MPI 5.0 já está disponível como parte do instalador do EFA v1.30.0. Basta executar o instalador e ativar o módulo Open MPI 5.0 para começar a usar. Os desenvolvedores que desejam usar o RDMA da GPUDirect podem fazer isso nas instâncias P4 e P5 do Amazon EC2.

Saiba mais sobre como executar o Open MPI 5.0 com o EFA e baixe o instalador mais recente do EFA.