게시된 날짜: Oct 17, 2023
AWS는 Amazon SageMaker에서 실시간 및 비동기식 추론을 위한 기계 학습(ML) 모델을 배포할 수 있는 ml.p4d 인스턴스를 아시아 태평양(도쿄) 및 유럽(프랑크푸르트) 리전에서 정식 버전으로 제공한다고 발표했습니다.
ml.p4d.24xlarge 인스턴스는 딥 러닝 모델을 위한 고성능 인스턴스를 제공합니다. Nvidia A100 GPU당 40GB의 메모리를 탑재한 P4d 인스턴스는 자연어 처리, 객체 탐지 및 추천 엔진과 같은 애플리케이션에서 대규모 모델 및 생성형 AI에 대해 고성능 기계 학습 추론을 지원합니다.