게시된 날짜: Dec 21, 2023

AWS는 오늘 Open MPI 5.0을 지원하는 Elastic Fabric Adapter(EFA) 설치 프로그램의 최신 릴리스를 발표했습니다.

EFA는 높은 수준의 노드 간 통신이 필요한 워크로드에 대해 지연 시간이 짧은 고대역폭 네트워킹 인터페이스를 제공합니다. Open MPI 5.0은 유명한 오픈 소스 메시지 전달 인터페이스(MPI) 구현의 최신 버전으로, MPI 표준 4.0과의 호환성이 개선되었으며 MPI 세션, Hierarchical AutotuNed(HAN) 집합, GPUDirect RDMA 지원과 같은 새로운 기능을 포함합니다.

MPI 세션을 통해 MPI 프로세스 내의 여러 라이브러리가 MPI API를 호출할 수 있으며, 월드 커뮤니케이터 초기화의 병목 현상을 해결할 수 있습니다. HAN 집합은 이제 전체 지연 시간과 대역폭을 개선하기 위한 기본 MPI 집합체입니다. 마지막으로 Open MPI 5.0은 이제 지점 간 통신을 위한 GPUDirect RDMA를 지원합니다. 개발자는 GPUDirect RDMA를 통해 CPU를 우회하여 NVIDIA GPU 및 EFA와 같은 기타 PCI-E 디바이스 간에 직접 메모리를 전송할 수 있습니다. 이제 고성능 컴퓨팅(HPC) 개발자는 NVIDIA A100 및 H100 GPU 기반 Amazon EC2 인스턴스를 활용하여 EFA 및 Open MPI 5.0을 통해 클라우드에서 확장성이 뛰어난 HPC 클러스터를 구축할 수 있습니다. 

이제 Open MPI 5.0을 EFA 설치 프로그램 v1.30.0의 일부로 사용할 수 있습니다. 설치 프로그램을 실행하고 Open MPI 5.0 모듈을 활성화하기만 하면 바로 시작할 수 있습니다. GPUDirect RDMA를 사용할 계획이 있는 개발자는 Amazon EC2 P4 및 P5 인스턴스에서 이를 수행하면 됩니다.

EFA로 Open MPI 5.0을 실행하는 방법에 대해 자세히 알아보고 최신 EFA 설치 프로그램을 다운로드하세요.