게시된 날짜: Nov 2, 2020

자연어 처리, 객체 탐지 및 분류, 지진 분석, 유전자 연구 등의 응용 분야를 위해 최고 성능의 기계 학습(ML) 훈련과 고성능 컴퓨팅(HPC)을 클라우드에서 제공하는 차세대 GPU 기반 인스턴스인 Amazon EC2 P4d 인스턴스가 출시되었습니다. P4d 인스턴스는 최신 NVIDIA A100 Tensor Core GPU로 실행되며 Elastic Fabric Adapter(EFA) 및 NVIDIA GPUDirect RDMA(원격 다이렉트 메모리 액세스)를 지원하는 최초의 클라우드 400Gbps 인스턴스 네트워킹을 제공하여 멀티 노드 ML 학습 및 HPC 워크로드의 효율적인 확장을 지원합니다.

P4d 인스턴스에서는 이전 세대 P3 인스턴스에 비해 학습 비용의 최대 60% 감소, 2.5배 증가한 메모리를 통한 딥 러닝 성능의 2.5배 이상 향상, 배정밀 부동 소수점 성능의 2배 증가, 네트워크 대역폭의 16배 향상, 로컬 NVMe 기반 SSD 스토리지의 4배 증가가 달성되었습니다.

P4d 인스턴스는 하이퍼스케일 클러스터인 EC2 UltraClusters에 배포되어 4,000개 이상의 NVIDIA A100 GPU, 페타비트 규모의 비차단 네트워킹 인프라 및 FSx for Lustre를 통한 고처리량 저지연 스토리지를 제공합니다. 이러한 EC2 UltraClusters는 세계 최고의 슈퍼컴퓨터 중 하나이며 매일 개발자, 데이터 사이언티스트 및 연구진이 설정이나 유지보수 비용 없이 액세스할 수 있습니다. 이러한 EC2 UltraClusters를 활용하면 개발자는 멀티 노드 ML 교육 또는 HPC 애플리케이션을 수천 개의 GPU로 확장하여 가장 복잡한 문제를 해결하거나 몇 개의 인스턴스만으로 축소하여 사용하는 인스턴스의 비용만 지불할 수 있습니다.

Amazon EC2 P4d 인스턴스는 격리된 다중 테넌시, 프라이빗 네트워킹 및 빠른 로컬 스토리지를 통해 효율적이고 유연하며 안전한 클라우드 서비스를 제공할 수 있도록 AWS에서 설계한 하드웨어 및 소프트웨어 혁신 기능 모음인 AWS Nitro System을 기반으로 구축되었습니다.

P4d 인스턴스는 현재 AWS 미국 동부(버지니아 북부) 및 미국 서부(오레곤) 리전에서 사용할 수 있습니다. 그리고 p4d.24xl 크기로 이용할 수 있어, 96개의 vCPU, 8개의 NVIDIA A100 GPU, 1.1TB의 인스턴스 메모리, 8TB의 로컬 NVMe 기반 SSD 스토리지, EFA 및 GPUDirect RDMA 포함 400Gbps 네트워킹 대역폭 및 19Gbps의 EBS 버스트 대역폭이 제공됩니다. P4d 인스턴스는 Savings Plans의 일부로 온디맨드 방식을 통해 예약 인스턴스 또는 스팟 인스턴스로 구입할 수 있습니다.

Amazon SageMaker, Amazon Elastic Kubernetes Service(EKS), Amazon Elastic Container Service(ECS), AWS ParallelCluster 및 AWS Batch 등 인기 있는 ML 및 오케스트레이션용 AWS 서비스도 몇 주 이내에 P4d 인스턴스를 지원할 예정입니다. Toyota Research Institute, GE Healthcare 및 Aon PathWise 등 포춘지 선정 500대 기업부터 스타트업 기업에 이르는 고객사들이 미리 보기 프로그램에 참여했으며 P4d 인스턴스를 도입하여 학습 시간을 단축하고 ML 모델 학습에 소요되는 비용을 절감하고 있습니다. Amazon EC2 P4d 인스턴스를 시작하려면 AWS Management Console, AWS 명령줄 인터페이스(CLI) 또는 AWS SDK를 방문하십시오. 자세한 내용은 제품 개요 페이지 또는 제품 세부 정보 페이지를 참조하십시오.