게시된 날짜: Oct 17, 2023
Amazon SageMaker에서 기계 학습(ML) 모델의 비동기식 및 실시간 추론을 위한 ml.p4d, ml.trn1, ml.g5 인스턴스의 평가판을 지원하는 새로운 리전을 발표하게 되었습니다. 다른 리전에서는 추론을 위해 이러한 인스턴스의 정식 버전을 사용할 수 있습니다.
- 이제 AWS GovCloud(미국 서부), 유럽(아일랜드), 아시아 태평양(도쿄) 및 아시아 태평양(싱가포르) 리전에서 평가판으로 제공되는 ml.p4d.24xlarge 인스턴스는 딥 러닝 모델을 위한 고성능 인스턴스를 제공합니다. Nvidia A100 GPU당 40GB의 메모리를 탑재한 P4d 인스턴스를 사용하면 대규모 모델 및 생성형 AI 사용 사례에서 고성능 기계 학습 추론을 수행할 수 있습니다.
- 현재 미국 서부(오레곤)에서 평가판으로 제공되는 ml.trn1 인스턴스는 텍스트 요약, 코드 생성, 질의 응답과 같은 애플리케이션을 아우르는 1,000억 개 이상의 파라미터 딥 러닝 및 생성형 AI 모델에서 고성능 추론 워크로드를 지원합니다.
- 현재 아시아 태평양(서울) 및 남아메리카(상파울루)에서 평가판으로 제공되는 ml.g5 인스턴스는 추천, 챗봇, 스마트 도우미, 이미지 인식과 같은 사용 사례에 적합합니다.