게시된 날짜: Jul 26, 2023
오늘 AWS는 최신 NVIDIA H100 Tensor Core GPU로 구동되는 Amazon Elastic Compute Cloud(Amazon EC2) P5 인스턴스를 정식 출시했습니다. 이러한 인스턴스는 딥 러닝 및 고성능 컴퓨팅(HPC) 애플리케이션을 위해 Amazon EC2에서 가장 높은 성능을 제공합니다. 이전 세대 GPU 기반 인스턴스 대비 솔루션을 구현하는 시간을 최대 6배 앞당기고 ML 모델 훈련 비용을 최대 40%까지 절감할 수 있습니다.
Amazon EC2 P5 인스턴스를 사용하여 점점 복잡해지는 대규모 언어 모델(LLM) 및 가장 까다로운 생성형 AI 애플리케이션을 지원하는 Diffusion 모델을 훈련하고 배포할 수 있습니다. 여기에는 질문 응답, 코드 생성, 비디오 및 이미지 생성, 음성 인식 등이 포함되어 있습니다. 또한 P5 인스턴스를 사용하여 제약 발견, 지진 분석, 기상 예측 및 금융 모델링에서 까다로운 HPC 애플리케이션을 대규모로 배포할 수 있습니다.
이러한 성능 개선 사항과 비용 절감을 위해 P5 인스턴스는 NVIDIA H100 Tensor Core GPU를 이전 세대 GPU 기반 인스턴스 대비 2배 더 뛰어난 CPU 성능, 2배 더 높은 시스템 메모리, 4배 더 많은 로컬 스토리지를 제공합니다. 2세대 Elastic Fabric Adapter(EFA) 기술을 사용하여 최대 3,200Gbps의 네트워킹을 통해 분산 훈련 및 긴밀하게 결합된 HPC 워크로드를 위한 업계 최고의 확장 기능을 제공합니다. 대규모 확장에 대한 고객의 요구를 짧은 지연 시간으로 해결하기 위해 P5 인스턴스가 Amazon EC2 UltraClusters에 배포됩니다. 최대 20,000개의 H100 GPU에 페타비트 규모의 비차단 상호 연결을 제공하여 최대 20엑사플롭스의 총 컴퓨팅 기능을 제공합니다.
이제 P5 인스턴스는 미국 동부(버지니아 북부) 및 미국 서부(오레곤) 등의 AWS 리전에서 p5.48xl 크기로 제공됩니다.
P5 인스턴스에 대해 자세히 알아보려면 Amazon EC2 P5 인스턴스를 참조하세요.