AWS Parallel Computing Service(AWS PCS), Slurm v25.05 지원

게시된 날짜: 2025년 10월 17일

AWS Parallel Computing Service(AWS PCS)에서 Slurm v25.05를 지원합니다. 따라서 이제 최신 Slurm v25.05를 실행하는 AWS PCS 클러스터를 생성할 수 있습니다.

이번 PCS의 Slurm v25.05 릴리스는 향상된 멀티 클러스터 sackd 구성, 인스턴스 시작 실패에 대한 개선된 requeue 동작 등 새로운 Slurm 기능을 제공합니다. 이번 릴리스로 로그인 노드는 이제 sackd 재구성이나 재시작 없이도 여러 클러스터를 제어할 수 있게 되었습니다. 따라서 관리자는 사용자를 위해 여러 클러스터에 대한 액세스를 미리 구성할 수 있습니다. 새로운 requeue 동작은 용량 부족 시 실패한 인스턴스 시작을 자동으로 재시도하여 작업 스케줄링의 복원력을 높이고, 결과적으로 클러스터의 전반적인 신뢰성이 향상됩니다.

AWS PCS는 Slurm을 사용하여 AWS에서 고성능 컴퓨팅(HPC) 워크로드를 좀 더 쉽게 실행하고 확장할 수 있도록 지원하는 관리형 서비스입니다. PCS에 대한 자세한 내용은 서비스 설명서AWS 리전 표를 참조하세요.