Amazon Web Services 한국 블로그

Amazon EC2 G7 인스턴스 발표: NVIDIA RTX PRO 4500 Blackwell Server Edition GPU 지원

오늘 AWS는 AI 추론, 그래픽 및 데이터 분석 워크로드를 위한 고성능 GPU 가속화 기능을 제공하는 Amazon Elastic Compute Cloud(Amazon EC2) G7 인스턴스의 정식 출시를 발표합니다.

AWS는 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU를 지원하는 최초의 메이저 클라우드 제공업체입니다. G7 인스턴스는 맞춤형 6세대 인텔 제온 스케일러블 프로세서를 탑재한 이 GPU로 가속화되어, G6 인스턴스에 비해 최대 4.6배 향상된 AI 추론 성능과 최대 2.1배 향상된 그래픽 성능을 제공합니다. 아울러, G7 인스턴스는 Amazon Elastic Kubernetes Service(Amazon EKS) 기반 Amazon EMR에서 더 빠른 GPU 가속 분석 성능을 제공합니다. G7 인스턴스는 AI 추론, 그래픽 렌더링, 비디오 트랜스코딩 및 분석, 공간 컴퓨팅, 가상 데스크톱 인프라(VDI), 데이터 분석 등 다양한 GPU 지원 워크로드에 적합합니다.

G7 인스턴스가 이전 세대와 비교하여 개선된 점은 다음과 같습니다.

  • 더 빠른 GPU 메모리 – NVIDIA RTX PRO 4500 Blackwell Server Edition GPU는 G6 인스턴스 대비 1.33배의 GPU 메모리 용량과 2.45배의 GPU 메모리 대역폭을 제공합니다. GPU당 32GB의 GPU 메모리, 5세대 텐서 코어, 4세대 RT 코어를 탑재한 G7 인스턴스는 향상된 AI 추론 및 그래픽 성능을 제공합니다.
  • 고성능 네트워킹 및 스토리지 – G7 인스턴스는 700Gbps의 EFA 지원 네트워킹 처리량(G6에 비해 7배)을 제공하므로, AI 추론, 그래픽 집약적인 애플리케이션 및 GPU 가속 데이터 분석 워크로드에서 최상의 성능을 발휘하는 데 필요한 지연 시간이 짧은 고대역폭 연결을 구현할 수 있습니다. G7 인스턴스는 최대 7.6TB의 로컬 NVMe SSD 스토리지를 지원하므로, 대규모 모델과 데이터 세트를 컴퓨팅 리소스 가까이에 유지하고, 데이터 전송 오버헤드를 줄이고, 처리량을 개선할 수 있습니다.
  • 고급 비디오 인코딩 및 디코딩 엔진 – 9세대 NVENC 및 6세대 NVDEC 엔진은 고해상도 비디오 워크플로에서 4:2:2 인코딩 및 디코딩을 지원하여, 이전 세대 G6 인스턴스에 비해 1.5배 확장된 동시 비디오 스트림을 제공합니다.

EC2 G7 인스턴스 사양
G7 인스턴스에는 최대 8대의 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU가 탑재되며, 최대 256GB(GPU당 메모리 32GB)의 총 GPU 메모리와 맞춤형 인텔 제온 스케일러블 프로세서가 사용됩니다. 또한 7개 크기로 제공되며 최대 192대의 vCPU, 최대 700Gbps의 네트워크 대역폭, 최대 768GiB의 시스템 메모리와 최대 7.6TB의 로컬 NVMe SSD 스토리지도 지원됩니다.

사양은 다음과 같습니다.

인스턴스 이름 GPU GPU 메모리(GB) vCPU 메모리(GiB) 스토리지 EBS 대역폭(Gbps) 네트워크 대역폭(Gbps)
g7.2xlarge 1 32 8 32 1 x 600 최대 8 최대 60
g7.4xlarge 1 32 16 64 1 x 600 8 최대 100
g7.8xlarge 1 32 32 128 1 x 950 16 최대 100
g7.12xlarge 2 64 48 192 1 x 1900 20 175
g7.24xlarge 4 128 96 384 1 x 3800 40 350
g7.48xlarge 8 256 192 768 2 x 3800 80 700
g7.metal* 8 256 192 768 2 x 3800 80 700

* 곧 제공 예정

G7 인스턴스는 NVIDIA GPUDirect P2P를 통한 다양한 GPU 크기, EFA를 사용한 NVIDIA GPUDirect RDMA, Amazon FSx for Lustre를 사용한 GPUDirect RDMA를 지원하므로, 멀티 GPU 및 멀티 노드 워크로드에서 지연 시간이 짧은 GPU 간 통신을 구현할 수 있습니다.

AI 추론 및 그래픽 워크로드를 지원하도록 사전 패키징된 GPU 드라이버가 포함된 AWS Deep Learning AMI(DLAMI) 또는 NVIDIA Workstation AMI를 사용하여 G7 인스턴스를 시작할 수 있습니다. Amazon EKS에 G7 인스턴스를 사용하려면 EKS에서 제공하는 자동화 기능을 지원하는 NVIDIA 드라이버 버전 R595로 EKS AMI를 구축해야 합니다. G7 인스턴스는 Amazon Linux, Ubuntu, RHEL, Windows Server 등 다양한 운영 체제를 지원하며, 포괄적인 NVIDIA 드라이버 통합을 통해 DirectX, Vulkan, OpenGL 등 업계 표준 그래픽 라이브러리와의 호환성을 제공합니다.

지금 시작하기
오늘부터 미국 동부(오하이오)와 미국 서부(오리건)의 두 AWS 리전에서 Amazon EC2 G7 인스턴스를 사용할 수 있습니다. 향후 리전 확장 계획을 확인하려면 WS Capabilities by Region 페이지의 CloudFormation 리소스 탭에서 인스턴스 유형을 검색하세요.

G7 인스턴스는 온디맨드, 절감형 플랜, 스팟 인스턴스를 비롯한 여러 구매 옵션을 통해 제공됩니다. 12xlarge, 24xlarge48xlarge 크기의 전용 인스턴스도 지원됩니다. 자세한 요금은 Amazon EC2 요금 페이지를 참조하세요.

시작할 준비가 되셨나요? Amazon EC2 콘솔에서 G7 인스턴스를 시작하세요. 자세한 내용은 Amazon EC2 G7 인스턴스 페이지를 참조하세요. 여러분의 의견을 기다립니다. AWS re:Post for EC2를 통해 공유하거나 AWS Support 담당자를 통해 보내주세요.

– Daniel Abib