게시된 날짜: Oct 17, 2023

Amazon SageMaker에서 실시간 및 비동기식 추론용 기계 학습(ML) 모델을 배포하기 위한 ml.p5.48xlarge 인스턴스의 평가판을 발표하게 되었습니다.

NVIDIA H100 Tensor Core GPU당 80GB의 메모리(총 640GB), 30TB의 로컬 NVMe SSD 스토리지, 192개의 vCPU 및 2TiB의 인스턴스 메모리를 갖춘 ml.p5.48xlarge 인스턴스는 질문 답변, 코드 생성, 비디오 및 이미지 생성 및 음성 인식과 같은 컴퓨팅 집약적인 AI 워크로드에 대한 고성능 기계 학습 추론을 가능하게 하도록 구축되었습니다.

이제 ml.p5.48xlarge 인스턴스는 미국 동부(버지니아 북부) 및 미국 서부(오리건) 리전의 SageMaker에서 사용할 수 있습니다.

평가판에 액세스하려면 AWS Service Quotas를 통해 한도 증가를 요청하기만 하면 됩니다. 이러한 인스턴스에 대한 요금 정보는 요금 페이지를 참조하세요. SageMaker를 사용한 모델 배포에 대한 자세한 내용은 개요설명서를 참조하세요. P5 인스턴스에 대한 전반적인 내용을 알아보려면 P5 제품 페이지로 이동하세요.