Amazon SageMaker HyperPod
수천 개의 AI 액셀러레이터에서 생성형 AI 모델 개발 규모 조정 및 가속화
SageMaker HyperPod란 무엇인가요?
Amazon SageMaker HyperPod는 생성형 AI 모델 빌드와 관련된 차별화되지 않은 복잡한 작업을 제거합니다. 수백 또는 수천 개의 AI 액셀러레이터로 구성된 클러스터에 걸쳐 학습, 미세 조정 또는 추론과 같은 모델 개발 작업을 빠르게 규모 조정할 수 있습니다. SageMaker HyperPod는 모든 모델 개발 작업에 대한 중앙 집중식 거버넌스를 지원하여 다양한 작업의 우선 순위가 지정되는 방식, 컴퓨팅 리소스가 각 작업에 할당되는 방식을 완벽하게 파악하고 제어할 수 있으므로 클러스터의 GPU 및 AWS Trainium 활용도를 극대화하고 혁신을 가속화하는 데 도움이 됩니다.
대규모 분산 훈련용 목적별 솔루션
SageMaker HyperPod를 사용하면 훈련 워크로드를 모든 액셀러레이터에 효율적으로 분배하고 병렬화할 수 있습니다. SageMaker HyperPod는 공개적으로 사용 가능한 인기 모델에 대해 최적의 훈련 구성을 자동으로 적용하여 최적의 성능을 빠르게 달성할 수 있도록 지원합니다. 또한 클러스터에서 인프라 장애를 지속적으로 모니터링하여 자동으로 문제를 해결하고 사람의 개입 없이 워크로드를 복구하므로 훈련 시간을 최대 40% 단축할 수 있습니다.
SageMaker HyperPod의 이점
모든 모델 개발 작업에 대한 중앙 집중식 거버넌스로 비용 절감
SageMaker HyperPod 태스크 거버넌스 혁신은 훈련 및 추론과 같은 생성형 AI 모델 개발 작업 전반의 컴퓨팅 리소스 할당에 대한 완전한 가시성과 제어 기능을 제공합니다. SageMaker HyperPod는 작업 대기열을 자동으로 관리하여 가장 중요한 작업의 우선 순위를 지정하고 예산에 맞춰 완료하는 동시에 컴퓨팅 리소스를 더욱 효율적으로 사용하여 모델 개발 비용을 최대 40% 절감합니다.
레시피와 도구를 사용하여 최첨단 성능 구현
SageMaker HyperPod 레시피를 사용하면 기술 분야와 관계없이 데이터 과학자와 개발자가 몇 분 만에 공개적으로 사용 가능한 생성형 AI 모델을 훈련하고 미세 조정할 수 있는 동시에 최첨단 성능의 이점을 누릴 수 있습니다. 또한 업계 최고의 가격 대비 성능과 짧은 지연 시간을 유지하면서 생성형 AI 애플리케이션의 정확도를 개선하는 레시피를 사용하여 비즈니스별 사용 사례에 맞게 Nova Micro, Nova Lite, Nova Pro를 비롯한 Amazon Nova 파운데이션 모델(FM)을 사용자 지정할 수 있습니다. 또한 SageMaker HyperPod는 모델 성능을 향상시키는 데 도움이 되는 내장된 실험 및 관찰성 도구를 제공합니다.
수천 개의 AI 액셀러레이터에 걸쳐 효율적으로 모델 훈련 확장 및 병렬화
복원력이 뛰어난 개발 환경으로 방해 요소 제거
오픈 웨이트 모델 배포 가속화
SageMaker HyperPod는 SageMaker JumpStart의 오픈 웨이트 모델 배포와 Amazon S3 및 Amazon FSx의 미세 조정 모델 배포를 가속화하는 데 도움이 됩니다. 자동 프로비저닝, 태스크 거버넌스를 통한 컴퓨팅 리소스 관리, 실시간 성능 모니터링, 향상된 관찰성 기능을 활용하여 모델 배포 작업을 간소화할 수 있습니다.