Amazon EC2 단일 GPU P5 인스턴스, 정식 버전으로 제공 시작

게시된 날짜: 2025년 8월 12일

오늘 AWS는 NVIDIA H100 GPU 1개를 탑재한 새로운 Amazon Elastic Compute Cloud(Amazon EC2) P5 인스턴스 크기를 발표했습니다. 이를 통해 기업은 기계 학습(ML) 및 고성능 컴퓨팅(HPC) 리소스의 규모를 비용 효율적으로 적절히 조정할 수 있습니다.

새로운 인스턴스 크기는 작게 시작하고 세분화된 단위로 확장하여 인프라 비용을 더 유연하게 제어할 수 있도록 지원합니다. 챗봇이나 특화된 언어 번역 도구 등 중소 규모 언어 모델(LLM)을 개발하는 고객은 이제 추론 작업을 더 경제적으로 실행할 수 있습니다. 아울러 이 인스턴스를 활용하여 신약 개발, 유체 흐름 분석, 금융 모델링 등의 HPC 애플리케이션을 비용이 많이 드는 대규모 GPU 배포 없이도 실행할 수 있습니다.

P5.4xLarge 인스턴스는 현재 미국 동부(버지니아 북부, 오하이오), 미국 서부(오리건), 유럽(런던), 아시아 태평양(뭄바이, 시드니, 도쿄), 남아메리카(상파울루)의 AWS 리전에서 Amazon EC2 Capacity Blocks for ML을 통해 사용할 수 있습니다. 이 인스턴스는 유럽(런던), 아시아 태평양(뭄바이, 자카르타, 도쿄), 남아메리카(상파울루) 리전에서 온디맨드나 스팟, 절감형 플랜을 통해 구매할 수 있습니다.

P5.4xLarge 인스턴스에 대해 자세히 알아보려면 Amazon EC2 P5 인스턴스 페이지를 확인하세요.