새로운 리전으로 확장되는 Amazon EC2 Capacity Blocks

게시된 날짜: 2024년 11월 12일

Amazon Web Services는 오늘 미국 서부(오리건)와 아시아 태평양(도쿄)의 두 신규 리전에서 Amazon Elastic Compute Cloud(Amazon EC2) Capacity Blocks for ML을 P5 인스턴스에 사용할 수 있게 되었다고 발표했습니다. EC2 Capacity Blocks를 사용하여 기계 학습(ML) 워크로드를 실행하는 데 필요한 시간만큼 인기 있는 Amazon EC2 UltraCluster의 GPU 인스턴스를 향후 날짜에 예약할 수 있습니다.

EC2 Capacity Blocks를 사용하면 1~64 인스턴스(512개의 GPU)의 클러스터 크기에서 최대 28일 동안 최대 8주 전에 GPU 용량을 예약할 수 있으므로 광범위한 ML 워크로드를 유연하게 실행할 수 있습니다. 단기간 사전 훈련 및 워크로드 미세 조정, 신속한 프로토타이핑 및 추론 수요 급증 처리에 이상적입니다. EC2 Capacity Blocks는 Amazon EC2 UltraCluster의 콜로케이션을 통해 지연 시간이 짧고 처리량이 높은 연결을 제공합니다.

이번 확장으로 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건) 및 아시아 태평양(도쿄)의 P5 인스턴스, 미국 동부(오하이오)의 P5e 인스턴스, 미국 동부(오하이오) 및 미국 서부(오리건)의 P4d 인스턴스, 아시아 태평양(멜버른)의 Trn1 인스턴스 같은 인스턴스 유형 및 AWS 리전에서 EC2 Capacity Blocks for ML을 사용할 수 있습니다.

시작하려면 AWS Management Console, AWS Command Line Interface(AWS CLI) 및 AWS SDK로 이동하세요. 자세히 알아보려면 Amazon EC2 Capacity Blocks for ML 사용 설명서를 참조하세요.