Amazon SageMaker HyperPod는 이제 Slurm 클러스터를 위한 AMI 기반 노드 수명 주기 구성을 지원합니다.

게시된 날짜: 2026년 5월 7일

이제 Amazon SageMaker HyperPod는 AI/ML 훈련 워크로드를 실행하는 프로덕션 준비 환경에 필요한 소프트웨어 및 구성을 Slurm 클러스터 노드에 프로비저닝하는 AMI 기반 구성을 지원합니다. 따라서 수명 주기 구성 스크립트를 다운로드, 구성하거나 Amazon S3에 업로드할 필요가 없습니다. 클러스터를 준비하는 데 필요한 운영 단계가 적고 노드 프로비저닝 중에 수명 주기 구성 스크립트가 실행되지 않으므로, 클러스터 생성 시간이 크게 단축되어 작업을 더 빨리 시작할 수 있습니다.

AMI 기반 구성에는 Docker, Enroot, Pyxis 같은 필수 소프트웨어와 Slurm 어카운팅, SSH 키 생성, Slurm 로그 회전, 사용자 홈 디렉토리 설정 같은 구성이 포함됩니다. AMI 기반 구성을 활성화하려면 CreateCluster API를 사용하여 클러스터를 생성할 때 또는 SageMaker AI 콘솔을 사용할 때 인스턴스 그룹 구성에서 LifeCycleConfig 블록을 생략하고, 사용자 지정 설정의 수명 주기 스크립트에서 ‘없음’을 선택합니다. AMI 기반 구성 기준 외에 추가 사용자 지정을 원하는 경우 확장 스크립트를 제공할 수 있습니다. 이렇게 하면 사용자 구성, 관찰성 또는 LDAP 통합 등과 같이 추가하려는 기능 및 소프트웨어에만 집중할 수 있습니다.

API 및 SageMaker AI 콘솔 두 가지 모두를 통해 클러스터를 생성할 때 확장 스크립트를 구성할 수 있습니다. CreateCluster API를 사용하여 LifeCycleConfig 블록에 새로운 OnInitComplete 파라미터 및 SourceS3Uri를 지정합니다. 콘솔을 통해 Custom setup의 ‘Extension script file in S3’ 필드에 확장 스크립트에 S3 URI를 제공합니다. 프로비저닝에 대한 완전한 제어가 필요한 고급 사용 사례의 경우, 사용자 지정 수명 주기 구성 스크립트는 API 및 SageMaker AI 콘솔 두 가지 모두를 통해 계속 완벽하게 지원됩니다.

이 기능은 SageMaker HyperPod가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. AMI 기반 노드 수명 주기 구성을 사용하여 HyperPod Slurm 클러스터를 생성하는 작업을 시작하려면 SageMaker AI 개발자 안내서의 AWS CLI를 사용하여 SageMaker HyperPod 시작하기 또는 SageMaker AI 콘솔을 사용하여 SageMaker HyperPod 시작하기를 참조하세요.