EC2 용량 블록을 통해 정식 버전으로 제공되는 Amazon EC2 P5e 인스턴스

게시된 날짜: 2024년 9월 9일

최신 NVIDIA H200 Tensor Core GPU로 구동되는 Amazon Elastic Compute Cloud(Amazon EC2) P5e 인스턴스가 오늘 정식 출시되었습니다. EC2 용량 블록을 통해 제공되는 이러한 인스턴스는 Amazon EC2에서 최고의 딥 러닝 및 생성형 AI 추론 성능을 제공합니다.

Amazon EC2 P5e 인스턴스를 사용하여 점점 복잡해지는 대규모 언어 모델(LLM) 및 가장 까다로운 생성형 AI 애플리케이션을 지원하는 Diffusion 모델을 훈련시켜 배포할 수 있습니다. 또한 P5e 인스턴스를 사용하여 제약 발견, 지진 분석, 기상 예측 및 금융 모델링에서 까다로운 HPC 애플리케이션을 대규모로 배포할 수 있습니다.

P5e 인스턴스에서는 H200 GPU 8개가 제공되는데, 이러한 GPU는 P5 인스턴스에서 제공되는 H100 GPU에 비해 메모리 크기는 1.7배, 메모리 대역폭은 1.5배입니다. 2세대 Elastic Fabric Adapter(EFA) 기술을 사용하여 최대 3,200Gbps의 네트워킹을 통해 분산 훈련 및 긴밀하게 결합된 HPC 워크로드를 위한 업계 최고의 확장 기능을 제공합니다. 고객의 대규모 배포 요구를 충족하며 지연 시간은 짧은 P5e 인스턴스는 Amazon EC2 UltraClusters에 배포됩니다.

P5e는 현재 미국 동부(오하이오) AWS 리전에서 ML용 EC2 용량 블록을 통해 p5e.48xlarge 크기로 사용 가능합니다.

P5e 인스턴스에 대해 자세히 알아보려면 Amazon EC2 P5e 인스턴스를 참조하세요.