게시된 날짜: Aug 4, 2023
Amazon SageMaker 훈련 작업에서 이제 ml.p5 인스턴스가 지원됩니다. ml.p5 인스턴스는 클라우드에서 고성능 ML 훈련 애플리케이션용으로 특별히 구축된 NVIDIA H100 칩으로 구동됩니다. SageMaker에서 ml.p5 인스턴스를 사용하여 가장 까다로운 일부 모델을 훈련할 수 있습니다. 가장 까다로운 생성형 AI 애플리케이션을 지원하는 확산 모델과 대규모 언어 모델(LLM)을 예로 들 수 있습니다. 이러한 애플리케이션에는 질문 응답, 코드 생성, 비디오 및 이미지 생성, 음성 인식 등이 포함되어 있습니다.
ml.p5 인스턴스에는 현재 최대 8개의 최신 NVIDIA H100 Tensor Core GPU가 탑재되어 있습니다. P5 인스턴스는 이전 세대 GPU 기반 인스턴스 대비 2배 더 뛰어난 CPU 성능, 2배 더 많은 시스템 메모리, 4배 더 많은 로컬 스토리지로 NVIDIA H100 Tensor Core GPU를 보완합니다. 2세대 Elastic Fabric Adapter(EFA) 기술을 사용하여 최대 3,200Gbps의 네트워킹을 통해 분산 훈련 및 긴밀하게 결합된 HPC 워크로드를 위한 업계 최고의 확장 기능을 제공합니다.
오늘부터 AWS 미국 동부(버지니아 북부) 및 미국 서부(오레곤) 리전에서 SageMaker Model Training에 ml.p5.48xlarge 크기의 인스턴스를 사용할 수 있습니다.
ml.p5 인스턴스에 대한 자세한 내용은 P5 인스턴스 페이지에서 확인하세요. ml.p5 인스턴스 사용을 시작하려면 Amazon SageMaker 콘솔에 로그인하세요. Amazon SageMaker Model Training에 대해 자세히 알아보려면 웹 페이지로 이동하세요.