게시된 날짜: May 22, 2023
이제 AWS ParallelCluster 3.6이 정식 버전으로 제공됩니다. 새로운 주요 기능으로는 GPU 인스턴스의 자동 상태 확인 지원과 Red Hat Enterprise Linux(RHEL8) 지원을 들 수 있습니다. 이번 릴리스의 다른 중요한 기능은 다음과 같습니다.
- ParallelCluster에서 관리하지 않는 Slurm 설정을 사용자 지정하는 기능
- AWS CloudFormation을 사용하여 ParallelCluster를 관리하기 위한 프로그래밍 방식의 인터페이스
- 클러스터당 최대 50개의 대기열과 총 50개의 컴퓨팅 리소스 지원
- ParallelCluster UI의 태그 기반 비용 모니터링
- 대기열, 헤드 노드, ParallelCluster 관리형 스토리지에 대한 사용자 지정 리소스 태그 지원
- 디스크 사용량, 유휴 인스턴스 및 오류에 대한 확장된 Amazon CloudWatch 지표
- 구성 가능한 로그 교체로 헤드 노드 복원력 향상
이번 릴리스에 대한 세부 정보는 AWS ParallelCluster 3.6 릴리스 노트를 참조하세요.
AWS ParallelCluster는 R&D 고객과 IT 관리자가 AWS에서 고성능 컴퓨팅(HPC) 클러스터를 운영할 수 있도록 완벽하게 지원 및 유지 관리되는 오픈 소스 클러스터 관리 도구입니다. ParallelCluster는 AWS에서 과학, 엔지니어링 및 기계 학습(MLI) 워크로드를 대규모로 실행할 수 있는 탄력적으로 확장되는 HPC 클러스터에 클라우드 리소스를 자동으로 안전하게 프로비저닝하도록 설계되었습니다.