Amazon EC2 G7e 인스턴스, 이제 아시아 태평양(도쿄) 리전에서 사용 가능
오늘부터 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU로 가속화된 Amazon EC2 G7e 인스턴스를 아시아 태평양(도쿄) 리전에서 사용할 수 있습니다. G7e 인스턴스는 G6e에 비해 최대 2.3배의 추론 성능을 제공합니다.
고객은 G7e 인스턴스를 사용하여 대규모 언어 모델(LLM), 에이전틱 AI 모델, 멀티모달 생성형 AI 모델, 물리적 AI 모델을 배포할 수 있습니다. G7e 인스턴스는 공간 컴퓨팅 워크로드는 물론, 그래픽과 AI 처리 기능이 모두 필요한 워크로드에 최고의 성능을 제공합니다. G7e 인스턴스는 GPU당 96GB의 메모리, 5세대 인텔 제온 프로세서와 함께 최대 8개의 NVIDIA RTX PRO 6000 Blackwell Server Edition GPU를 갖추었습니다. 최대 192개의 가상 CPU(vCPU), 최대 1,600Gbps의 네트워킹 대역폭을 지원합니다. G7e 인스턴스는 멀티 GPU 워크로드의 성능을 끌어올리는 NVIDIA GPUDirect 피어 투 피어(P2P)를 지원합니다. 또한 멀티 GPU G7e 인스턴스는 EC2 UltraClusters에서 EFA와 함께 NVIDIA GPUDirect 원격 직접 메모리 액세스(RDMA)를 지원하여 소규모 다중 노드 워크로드의 지연 시간을 줄입니다.
Amazon EC2용 G7e 인스턴스를 사용할 수 있는 AWS 리전은 미국 서부(오리건), 미국 동부(버지니아 북부, 오하이오), 아시아 태평양(도쿄)입니다. 온디맨드 인스턴스, 스팟 인스턴스 또는 절감형 플랜의 일부로 G7e 인스턴스를 구매할 수 있습니다.
시작하려면 AWS Management Console, AWS Command Line Interface(CLI) 및 AWS SDK로 이동하세요. 자세히 알아보려면 G7e 인스턴스를 참조하세요.