- Amazon EC2›
- Tipi di istanza›
- Istanze G5
Istanze G5 di Amazon EC2
Istanze basate su GPU ad alte prestazioni per applicazioni ad alta intensità grafica e inferenza di machine learning
Perché scegliere le istanze Amazon EC2 G5?
Le istanze G5 di Amazon EC2 sono la generazione più recente di istanze basate su GPU NVIDIA che possono essere utilizzate per un'ampia gamma di casi d'uso di grafica intensiva e machine learning. Offrono prestazioni fino a 3 volte migliori per applicazioni ad alta intensità grafica e inferenze di machine learning e prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn di Amazon EC2.
I clienti possono utilizzare le applicazioni G5 ad alta intensità grafica come stazioni di lavoro remote, rendering video e gaming per produrre grafiche ad alta fedeltà in tempo reale. Con le istanze G5, i clienti del machine learning ottengono un'infrastruttura a prestazioni elevate ed efficiente in termini di costi per addestrare e implementare modelli più grandi e sofisticati per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.
Le istanze G5 sono dotate di un massimo di 8 processori NVIDIA e AMD EPYC di seconda generazione. Supportano inoltre fino a 192 vCPU, fino a 100 Gbps di larghezza di banda della rete e fino a 7,6 TB di archiviazione SSD NVMe locale.
Vantaggi
Le istanze G5 offrono prestazioni grafiche fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore rispetto alle istanze G4dn. Hanno più core di ray tracing rispetto a qualsiasi altra istanza EC2 basata su GPU, dispongono di 24 GB di memoria per GPU e supportano la tecnologia NVIDIA RTX. Per questo sono ideali per effettuare il rendering di scene realistiche in modo più rapido, eseguire potenti postazioni di lavoro virtuali e supportare applicazioni grafiche complesse con una maggiore fedeltà.
Le istanze G5 offrono prestazioni fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore per l'inferenza di machine learning rispetto alle istanze G4dn. Sono una soluzione altamente performante ed economica per i clienti che desiderano utilizzare librerie NVIDIA come TensorRT, CUDA e cuDNN per eseguire le proprie applicazioni di machine learning.
Le istanze G5 offrono di costi di addestramento inferiori fino al 15% rispetto alle istanze P3 di Amazon EC2. Offrono inoltre prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn. Per questo motivo sono una soluzione conveniente per l'addestramento di modelli di machine learning moderatamente complessi e a nodo singolo per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.
Le istanze G5 si basano sull'AWS Nitro System, una combinazione di hardware dedicato e hypervisor leggero che fornisce tutte le risorse di elaborazione e di memoria dell'hardware host alle istanze per prestazioni e sicurezza complessive migliori. Con le istanze G5, il sistema Nitro fornisce le GPU in modalità pass-through, fornendo prestazioni paragonabili a quelle del bare metal.
Caratteristiche
Le istanze G5 sono le prime nel cloud a utilizzare GPU NVIDIA A10G Tensor Core che offrono prestazioni elevate per applicazioni di machine learning e ad alta intensità di grafica. Ogni istanza include fino a 8 GPU A10G Tensor Core dotate di 80 core di ray tracing e 24 GB di memoria per GPU. Presentano anche 320 NVIDIA Tensor Core di terza generazione che offrono fino a 250 TOPS con prestazioni elevate per i carichi di lavoro di ML.
Le istanze G5 offrono ai clienti driver NVIDIA RTX Enterprise e gaming senza costi aggiuntivi. I driver NVIDIA RTX Enterprise possono essere usati per fornire workstation virtuali di alta qualità per un'ampia gamma di flussi di lavoro ad alta intensità grafica. I driver di gaming NVIDIA forniscono grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi. Le istanze G5 supportano anche le librerie CUDA, cuDNN, NVENC, TensorRT, cuBLas, OpenCL, DirectX 11/12, Vulkan 1.1 e OpenGL 4.5.
Le istanze G5 sono dotate di una velocità di trasmissione effettiva della rete fino a 100 Gbps, che consente loro di supportare le esigenze di bassa latenza dell'inferenza di machine learning e delle applicazioni ad alta intensità grafica. Grazie a 24 GB di memoria per GPU e la capacità di supportare fino a 7,6 TB di storage SSD NVMe locale, consentono l'archiviazione locale di modelli e set di dati di grandi dimensioni per l'addestramento e l'inferenza di machine learning a prestazioni elevate. Le istanze G5 possono anche archiviare file video di grandi dimensioni in locale, con un conseguente aumento delle prestazioni grafiche e della capacità di eseguire il rendering di file video più grandi e complessi.
Le istanze G5 sono basate su AWS Nitro System, che è una ricca raccolta di blocchi costitutivi che consente di scaricare molte delle tradizionali funzioni di virtualizzazione su hardware e software dedicati per offrire elevate prestazioni, alta disponibilità e alta sicurezza riducendo al contempo il sovraccarico della virtualizzazione.
Dettagli prodotto
|
|
Instance Size
|
GPU
|
GPU Memory (GiB)
|
vCPUs
|
Memory (GiB)
|
Storage (GB)
|
Network Bandwidth (Gbps)
|
EBS Bandwidth (Gbps)
|
||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
VM a GPU singola
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
VM a GPU multiple
|
|
|
|
|
|
|
|
|
Atenascopio
Athenascope sfrutta gli ultimi sviluppi nel campo della visione artificiale e dell'intelligenza artificiale per analizzare il gameplay, individuare automaticamente i momenti più avvincenti dei giochi e creare video salienti per videogiocatori e creatori di contenuti.
Il nostro obiettivo è creare un'esperienza video fluida, e a tale scopo è fondamentale utilizzare i nostri modelli di CV per ottenere un'analisi video a bassa latenza. Le istanze Amazon EC2 G5 offrono un rapporto prezzo/prestazioni del 30% migliore rispetto alle precedenti implementazioni con istanze G4dn.
Chris Kirmse, CEO & Founder di Athenascope
Netflix
Netflix è uno dei principali servizi di intrattenimento in streaming al mondo, con oltre 214 milioni di abbonati in più di 190 Paesi che possono fruire di serie TV, documentari e lungometraggi in un'ampia varietà di generi e lingue.
Grazie alle nuove istanze G5 di Amazon EC2, possiamo effettuare il provisioning di workstation grafiche di gamma elevata che offrono prestazioni fino a 3 volte superiori rispetto alle workstation con istanze G4dn di EC2. Con le istanze G5, i creatori hanno la possibilità di creare contenuti in modo più complesso e realistico per gli spettatori.
Ben Tucker, Technical Lead, Animation Production Systems Engineering presso Netflix
Varjo
Per le applicazioni VR/XR di fascia alta, le istanze Amazon EC2 G5 sono rivoluzionarie. Siamo in grado di eseguire applicazioni professionali con la risoluzione tipica di Varjo, che raggiunge i livelli dell'occhio umano, con una frequenza di fotogrammi tre volte superiore rispetto alle istanze G4dn utilizzate in precedenza, offrendo ai nostri clienti un'esperienza di qualità ineguagliata durante lo streaming dal server.
Urho Konttori, fondatore e Chief Technology Officer presso Varjo
Nozioni di base sulle istanze G5
Le DLAMI forniscono ai ricercatori e agli esperti di ML l'infrastruttura e gli strumenti nel cloud necessari per velocizzare i processi di DL su qualsiasi scala. I Container per il Deep Learning, immagini Docker preinstallate con framework di DL, semplificano l'implementazione degli ambienti di ML personalizzati poiché consentono di saltare il complicato processo di creazione e ottimizzazione degli ambienti ex novo.
Se preferisci gestire i tuoi carichi di lavoro containerizzati tramite i servizi di orchestrazione dei container, puoi implementare le istanze G5 con Amazon EKS o Amazon ECS.
Puoi utilizzare varie immagini Amazon Machine Images (AMI) offerte da AWS e NVIDIA, fornite con i driver NVIDIA installati.
Puoi distribuire modelli ML su istanze G5 utilizzando Amazon SageMaker, il servizio completamente gestito per la creazione, l'addestramento e la distribuzione di modelli ML.