Amazon EC2 UltraClusters를 선택해야 하는 이유
Amazon Elastic Compute Cloud(Amazon EC2) UltraClusters를 사용하면 수천 개의 GPU 또는 AWS Trainium 등 특별히 구축된 ML 액셀러레이터로 확장하여 슈퍼컴퓨터에 온디맨드로 액세스할 수 있습니다. 설정 또는 유지 관리 비용 없는 간단한 종량 과금제 사용량 모델을 통해 기계 학습(ML), 생성형 AI, 고성능 컴퓨팅(HPC) 개발자 누구나 슈퍼컴퓨터급 성능을 이용할 수 있습니다. Amazon EC2 P5 인스턴스, Amazon EC2 P4d 인스턴스, Amazon EC2 Trn1 인스턴스는 모두 Amazon EC2 UltraClusters에 배포됩니다.
EC2 UltraClusters는 지정된 AWS 가용 영역에 콜로케이션되고 페타비트 규모의 비차단 네트워크에서 Elastic Fabric Adapter(EFA) 네트워킹을 사용하여 상호 연결된 수천 개의 가속화된 EC2 인스턴스로 구성됩니다. EC2 UltraClusters는 가장 널리 사용되는 고성능 병렬 파일 시스템을 기반으로 구축된 완전관리형 공유 스토리지인 Amazon FSx for Lustre에 대한 액세스를 제공하여 방대한 데이터세트를 밀리초 미만의 지연 시간으로 신속하게 온디맨드 방식으로 대규모로 처리합니다. EC2 UltraClusters는 분산형 ML 훈련 및 긴밀하게 결합된 HPC 워크로드를 위한 스케일 아웃 기능을 제공합니다.
Amazon EC2 P5 인스턴스와 Trn1 인스턴스는 클러스터에서 홉 수와 지연 시간을 줄이고 확장성을 높일 수 있는 네트워크 패브릭을 제공하는 2세대 EC2 UltraClusters 아키텍처를 사용합니다.