AWS PCS, 이제 프로덕션에 바로 사용할 수 있는 딥 러닝 AMI 제공

게시된 날짜: 2026년 6월 1일

오늘 AWS Parallel Computing Service(AWS PCS)는 딥 러닝 기반 GPU AMI(Ubuntu 24.04)를 기반으로 구축되어 AWS에서 유지 관리하는 Amazon Machine Image인 PCS 지원 DLAMI를 출시했습니다. AI/ML 훈련과 고성능 컴퓨팅(HPC)을 위한 프로덕션 품질 기반을 제공하며, 핵심 인프라 구성 요소가 사전 설치되고, 호환성 테스트가 완료되어 있습니다.

AWS PCS는 관리형 서비스로, Slurm을 사용하여 AWS에서 HPC 워크로드를 실행 및 규모 조정하고 과학 및 엔지니어링 모델을 구축하는 작업을 쉽게 수행할 수 있도록 해줍니다. AWS PCS를 사용하여 컴퓨팅, 스토리지, 네트워킹, 시각화 도구를 통합하는 완벽하고 탄력적인 환경을 구축할 수 있습니다. AWS PCS는 관리형 업데이트와 내장된 관찰성 기능을 통해 클러스터 운영을 간소화하여 유지 관리 부담을 없애줍니다. 인프라에 대해 걱정하지 않고 연구와 혁신에 집중하면서 친숙한 환경에서 작업할 수 있습니다.

이 AMI는 소스 Deep Learning Base GPU AMI에서 운영 체제, NVIDIA GPU 드라이버, CUDA 툴킷, EFA 드라이버, Lustre 클라이언트를 상속하고 PCS 에이전트, PCS용 Slurm, EFS 유틸리티를 추가합니다. 지원되는 여러 Slurm 버전이 포함되어 있으며 클러스터 구성에 따라 최적 버전이 자동으로 활성화됩니다. 그 위에 프레임워크, 라이브러리, 애플리케이션 소프트웨어를 추가하여 환경을 완성할 수 있습니다. AWS는 소스 DLAMI 또는 PCS 구성 요소가 업데이트되면 업데이트된 AMI를 정기적으로 릴리스하여 지속적인 보안 패치와 드라이버 업데이트를 제공합니다.

AWS PCS 지원 DLAMI는 AWS PCS가 제공되는 모든 AWS 리전에서 추가 비용 없이 x86_64 및 arm64 아키텍처에서 사용할 수 있습니다. 시작하려면 컴퓨팅 노드 그룹을 구성할 때 PCS 지원 AMI를 지정하세요. 자세한 내용은 AWS PCS 사용 설명서PCS 지원 DLAMI 사용을 참조하세요. PCS 지원 DLAMI를 기반으로 구축된 참조 클러스터 아키텍처는 GitHub의 awsome-distributed-ai 리포지토리를 참조하세요.