게시된 날짜: Oct 17, 2023

Amazon SageMaker에서 기계 학습(ML) 모델의 비동기식 및 실시간 추론을 위한 ml.p4d, ml.trn1, ml.g5 인스턴스의 평가판을 지원하는 새로운 리전을 발표하게 되었습니다. 다른 리전에서는 추론을 위해 이러한 인스턴스의 정식 버전을 사용할 수 있습니다.

  • 이제 AWS GovCloud(미국 서부), 유럽(아일랜드), 아시아 태평양(도쿄) 및 아시아 태평양(싱가포르) 리전에서 평가판으로 제공되는 ml.p4d.24xlarge 인스턴스는 딥 러닝 모델을 위한 고성능 인스턴스를 제공합니다. Nvidia A100 GPU당 40GB의 메모리를 탑재한 P4d 인스턴스를 사용하면 대규모 모델 및 생성형 AI 사용 사례에서 고성능 기계 학습 추론을 수행할 수 있습니다.
  • 현재 미국 서부(오레곤)에서 평가판으로 제공되는 ml.trn1 인스턴스는 텍스트 요약, 코드 생성, 질의 응답과 같은 애플리케이션을 아우르는 1,000억 개 이상의 파라미터 딥 러닝 및 생성형 AI 모델에서 고성능 추론 워크로드를 지원합니다.
  • 현재 아시아 태평양(서울) 및 남아메리카(상파울루)에서 평가판으로 제공되는 ml.g5 인스턴스는 추천, 챗봇, 스마트 도우미, 이미지 인식과 같은 사용 사례에 적합합니다.

이러한 평가판에 액세스하려면 AWS Service Quotas를 통해 한도 증가를 요청하면 됩니다. 이러한 인스턴스에 대한 요금 정보는 요금 페이지에서 확인하세요. SageMaker를 사용한 모델 배포에 대해 자세히 알아보려면 여기에서 개요를 살펴보거나 여기에서 설명서를 참조하세요. 평가판으로 제공되는 인스턴스에 대해 자세히 알아보려면 G5 제품 페이지, Trn1 제품 페이지, P4 제품 페이지로 이동하세요.