Amazon SageMaker HyperPod, 오픈 웨이트 모델 배포 가속화
이제 Amazon SageMaker HyperPod는 Amazon SageMaker JumpStart의 오픈 웨이트 파운데이션 모델과 Amazon S3 및 Amazon FSX의 자체 미세 조정 모델 모두 Amazon SageMaker HyperPod에 직접 배포할 수 있도록 지원합니다. 이를 통해 동일한 HyperPod 컴퓨팅 리소스에서 모델을 원활하게 훈련, 미세 조정 및 배포하여 전체 모델 수명 주기에서 리소스 활용도를 극대화할 수 있습니다.
몇 가지 간단한 단계를 거쳐 SageMaker JumpStart에서 오픈 웨이트 기반 모델을 선택하고 이를 SageMaker HyperPod 클러스터에 빠르게 배포할 수 있습니다. SageMaker는 자동으로 인프라를 프로비저닝하고, 클러스터에 모델을 배포하고, 자동 크기 조정을 활성화하고, SageMaker 엔드포인트를 구성합니다. SageMaker는 모델 엔드포인트의 트래픽이 변경됨에 따라 HyperPod 태스크 거버넌스를 통해 컴퓨팅 리소스를 확장 및 축소하고, 모델 성능을 완전히 파악할 수 있도록 HyperPod 관찰성 대시보드에 지표를 자동으로 게시합니다.
SageMaker JumpStart의 모델은 미국 동부(버지니아 북부), 미국 서부(캘리포니아 북부), 미국 서부(오리건), 아시아 태평양(뭄바이), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(런던), 유럽(스톡홀름), 남아메리카(상파울루) 등 HyperPod가 제공되는 모든 AWS 리전에서 배포할 수 있습니다.
자세히 알아보려면 SageMaker HyperPod 웹 페이지, 블로그 및 설명서를 참조하세요.