Amazon SageMaker HyperPod, 이제 콘솔에서 클러스터를 생성하기 전에 서비스 할당량을 검증
Amazon SageMaker HyperPod 콘솔이 이제 클러스터 생성을 시작하기 전에 AWS 계정의 서비스 할당량을 검증합니다. 따라서 프로비저닝을 시작하기 전에 할당량이 충분한지 확인할 수 있습니다. SageMaker HyperPod를 사용하면 AI/ML 워크로드를 실행하고 대규모 언어 모델(LLM), 확산 모델, 파운데이션 모델(FM)과 같은 최첨단 모델을 개발하기 위한 복원력 있는 클러스터를 프로비저닝할 수 있습니다.
대규모 AI/ML 클러스터를 생성할 때는 인스턴스, 스토리지 및 네트워킹 리소스에 대한 계정의 할당량이 충분한지 확인해야 합니다. 하지만 이전에는 할당량 검증을 위해 여러 AWS 서비스를 수동으로 확인해야 했기 때문에, 클러스터 생성이 자주 실패했으며 할당량 한도 증가를 요청하지 못하면 시간을 낭비해야 했습니다. SageMaker HyperPod 콘솔의 새로운 할당량 검증 기능은 새 리소스를 생성할 때 인스턴스 유형 제한, EBS 볼륨 크기, VPC 관련 할당량을 포함한 클러스터 구성에 대해 계정 수준 할당량을 자동으로 확인합니다. 검증을 수행하면 각 할당량의 예상 사용량, 적용된 할당량 값 및 규정 준수 상태를 보여주는 명확한 표가 표시됩니다. 할당량이 초과될 수 있다면, 경 알림이 표시되고 Service Quotas 콘솔로 직접 연결되는 링크가 제공됩니다. 이 링크를 이용해 할당량 증가를 요청할 수 있습니다.
이 기능은 Amazon SageMaker HyperPod가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 수행한 서비스 할당량 유효성 검사의 전체 목록은 Amazon SageMaker HyperPod 용 설명서에서 확인할 수 있습니다.