AWS와 NVIDIA

GPU의 성능: 클라우드에서 엣지까지

AWS와 NVIDIA를 이용해야 하는 이유

AWS와 NVIDIA는 2010년부터 협력하여 고객에게 비용 효율적이며 유연한 대규모 GPU 가속화 솔루션을 지속적으로 제공하고 있습니다. 클라우드부터 엣지까지 아우르는 이러한 혁신은 인프라, 소프트웨어 및 서비스 전반으로 확장되어 AI를 구축하고 프로덕션에 배포할 때 솔루션 구현 시간을 단축하는 풀 스택 솔루션을 제공합니다. 여러 AWS 리전에서 사용할 수 있는 GPU 가속화 솔루션을 통해 고객은 짧은 지연 시간, 고성능 및 높은 신뢰성을 달성하는 데 필요한 컴퓨팅 성능을 활용할 수 있습니다. AWS와 NVIDIA는 2010년부터 협력하여 고객에게 비용 효율적이며 유연한 대규모 GPU 가속화 솔루션을 지속적으로 제공하고 있습니다. 클라우드부터 엣지까지 아우르는 이러한 혁신은 인프라, 소프트웨어 및 서비스 전반으로 확장되어 AI를 구축하고 프로덕션에 배포할 때 솔루션 구현 시간을 단축하는 풀 스택 솔루션을 제공합니다. 여러 AWS 리전에서 사용할 수 있는 GPU 가속화 솔루션을 통해 고객은 짧은 지연 시간, 고성능 및 높은 신뢰성을 달성하는 데 필요한 컴퓨팅 성능을 활용할 수 있습니다.

솔루션

생성형 AI 및 기계 학습

매우 복잡한 AI/ML 모델을 위한 GPU 인스턴스 및 소프트웨어

규모에 상관없이 모든 조직이 챗봇, 문서 분석, 코드 생성, 비디오 및 이미지 생성, 음성 인식, 신약 개발, 합성 데이터 생성 등에 생성형 AI를 사용하여 혁신을 가속화하고 고객 서비스를 개선하며 경쟁 우위를 확보하고 있습니다. 이러한 솔루션의 가치를 모두 실현하려면 조직은 자체 독점 데이터를 사용하여 AI 및 머신 러닝(ML) 모델을 사용자 정의해야 하는데, 모델을 처음부터 구축하려면 비용과 시간이 많이 듭니다. NVIDIA GPU로 구동되는 Amazon EC2 인스턴스는 점점 더 복잡해지는 LLM과 컴퓨팅 집약적인 생성형 AI 애플리케이션에 대한 훈련 및 추론을 가속화합니다. AWS Marketplace의 NVIDIA AI Enterprise에 포함된 NVIDIA NIM과 NeMo 마이크로서비스를 통해 조직은 생성형 AI 및 LLM의 잠재력을 대규모로 활용할 수 있습니다.

NVIDIA AI Enterprise에 대해 자세히 알아보기

고성능 컴퓨팅

AWS에서 HPC를 사용하여

고성능 컴퓨팅(HPC)을 사용하면 과학자와 엔지니어가 복잡하고 컴퓨팅 집약적인 문제를 신속하게 해결할 수 있습니다. HPC 애플리케이션에는 네트워크 성능, 고속 스토리지, 대용량 메모리, 컴퓨팅 기능이 모두 필요한 경우가 많습니다. AWS를 사용하면 고객은 클라우드에서 GPU 기반 HPC를 실행하고 대부분의 온프레미스 환경에서는 실현할 수 없었을 다수의 병렬 작업으로 확장함으로써 연구 속도를 높이고 결과를 얻을 때까지 걸리는 시간을 단축할 수 있습니다. NVIDIA GPU로 구동되는 Amazon EC2 인스턴스는 엔지니어링 시뮬레이션, 컴퓨팅 금융, 지진 해석, 분자 모델링, 유전체학, 렌더링 및 기타 고성능 컴퓨팅 워크로드를 실행하기에 적합한 플랫폼입니다.

NVIDIA H100 Tensor Core GPU로 구동되는 Amazon EC2 P5 인스턴스에 대해 자세히 알아보기

사물인터넷

로컬 작업을 수행할 수 있도록 AWS를 엣지 디바이스로 원활하게 확장

기계 학습이 탑재된 IoT 디바이스는 여러 가지 문제에 직면해 있습니다. 엣지의 제한된 컴퓨팅 리소스로 인해 ML 모델의 복잡성과 크기가 제한되는 동시에 보다 정교한 알고리즘의 필요성과 균형을 맞출 수 있습니다. 엣지 디바이스는 변조 및 악의적 공격에 더 취약한 경우가 많기 때문에 실시간 처리, 짧은 지연 시간 및 네트워크 보안을 보장하는 것이 가장 중요합니다. AWS IoT Greengrass는 AWS를 NVIDIA Jetson과 같은 엣지 디바이스로 원활하게 확장하므로, 계속해서 클라우드를 사용하여 데이터를 관리 및 분석하고 오랫동안 저장하는 동시에 디바이스에서 생성되는 데이터에 대한 로컬 작업을 수행할 수 있습니다.

Jetson 모듈 기반 NVIDIA DeepStream을 AWS IoT Core 및 AWS IoT Greengrass에 통합하는 방법에 대해 자세히 알아보기

산업용 메타버스

실제 시스템의 시뮬레이션을 손쉽게 생성하여 운영 최적화

많은 산업에서 물리적 개체를 정확하게 공간 인식이 가능한 몰입형으로 구현할 수 있는 실제 물체의 시뮬레이션을 활용하고 있습니다. 디지털 트윈과 기타 시뮬레이션을 포함하는 산업 메타버스는 연구자와 엔지니어가 가상 프로토타입 제작이나 공장에서의 원격 모니터링 등을 통해 더 잘 협업하고 제품을 테스트할 수 있도록 지원합니다. NVIDIA Omniverse는 개인과 팀이 OpenUSD(Universal Scene Description) 기반 3D 워크플로 및 애플리케이션을 개발할 수 있도록 지원하는 컴퓨팅 플랫폼입니다.

AWS 기반 NVIDIA Omniverse에 대해 자세히 알아보기

가상 워크스테이션

인력을 재배치하고 전 세계의 창의적인 인재 활용

원격 근무가 증가하고 HPC에 대한 수요가 증가함에 따라 업계에서 더욱 분산된 접근 방식을 채택하므로 성능이 뛰어난 워크스테이션에 대한 가상 액세스의 필요성도 증가하고 있습니다. NVIDIA의 GPU 기술을 통해 3D 모델링, 비디오 편집, AI 개발과 같은 그래픽 집약적인 작업을 클라우드에서 원활하게 실행하여 사용자에게 온프레미스 워크스테이션에서 일반적으로 기대하는 성능과 시각적 충실도를 제공할 수 있습니다. NVIDIA GPU가 탑재된 Amazon EC2 인스턴스에서 실행되며 NVIDIA RTX 기술을 사용하는 가상 워크스테이션은 유연성과 확장성을 향상시켜 지리적으로 분산된 팀을 위한 보다 민첩한 작업 환경을 제공합니다.

AWS 기반 가상 워크스테이션에 대해 자세히 알아보기

AWS 및 NVIDIA 서비스