생성형 AI 및 HPC에 최적화된 Amazon EC2 P5en 인스턴스 정식 출시

게시된 날짜: 2024년 12월 2일

최신 NVIDIA H200 Tensor Core GPU로 구동되는 Amazon Elastic Compute Cloud(Amazon EC2) P5en 인스턴스가 오늘 정식 출시되었습니다. 이러한 인스턴스는 딥 러닝 및 고성능 컴퓨팅(HPC) 애플리케이션을 위해 Amazon EC2에서 가장 높은 성능을 제공합니다.

Amazon EC2 P5en 인스턴스를 사용하여 점점 복잡해지는 대규모 언어 모델(LLM) 및 가장 까다로운 생성형 AI 애플리케이션을 지원하는 Diffusion 모델을 훈련하고 배포할 수 있습니다. 또한 P5en 인스턴스를 사용하여 제약 발견, 지진 분석, 기상 예측 및 금융 모델링에서 까다로운 HPC 애플리케이션을 대규모로 배포할 수 있습니다.

P5en 인스턴스에는 P5 인스턴스에 탑재된 H100 GPU보다 1.7배의 GPU 메모리 크기와 1.5배의 GPU 메모리 대역폭을 갖춘 최대 8개의 H200 GPU가 탑재되어 있습니다. H200 GPU와 고성능 사용자 지정 4세대 인텔 제온 확장형 프로세서가 사용된 P5en 인스턴스에서는 CPU와 GPU 간의 5세대 PCIe가 지원됩니다. 따라서 CPU와 CPU 간의 대역폭이 이전에 비해 4배나 증가하며, AI 훈련 및 추론 성능도 높아집니다. Nitro v5를 사용하는 3세대 EFA를 탑재한 P5en(최대 속도 3,200Gbps)은 이전 세대의 EFA와 Nitro를 사용하는 P5에 비해 지연 시간이 최대 3200% 개선되었습니다. 이를 통해 딥 러닝, 생성형 AI, 실시간 데이터 처리, 고성능 컴퓨팅(HPC) 애플리케이션과 같은 분산 훈련 워크로드의 집단 통신 성능을 개선할 수 있습니다. 지연 시간을 짧게 유지하면서 대규모로 워크로드를 처리해야 하는 고객의 요구를 충족하기 위해 P5en 인스턴스는 Amazon EC2 UltraClusters에 배포되며, 분산 훈련 및 긴밀하게 결합된 HPC 워크로드를 위한 업계 최고 수준의 스케일 아웃 기능을 제공합니다.

이제 미국 동부(오하이오), 미국 서부(오리건), 아시아 태평양(도쿄) AWS 리전과 미국 동부(애틀랜타) 로컬 영역 us-east-1-atl-2a에서 P5en 인스턴스가 p5en.48xlarge 크기로 제공됩니다.

P5en 인스턴스에 대해 자세히 알아보려면 Amazon EC2 P5en 인스턴스를 참조하세요.