Passa al contenuto principale

Amazon EC2

Istanze G5 di Amazon EC2

Istanze basate su GPU ad alte prestazioni per applicazioni ad alta intensità grafica e inferenza di machine learning

Perché scegliere le istanze Amazon EC2 G5?

Le istanze G5 di Amazon EC2 sono la generazione più recente di istanze basate su GPU NVIDIA che possono essere utilizzate per un'ampia gamma di casi d'uso di grafica intensiva e machine learning. Offrono prestazioni fino a 3 volte migliori per applicazioni ad alta intensità grafica e inferenze di machine learning e prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn di Amazon EC2.

I clienti possono utilizzare le applicazioni G5 ad alta intensità grafica come stazioni di lavoro remote, rendering video e gaming per produrre grafiche ad alta fedeltà in tempo reale. Con le istanze G5, i clienti del machine learning ottengono un'infrastruttura a prestazioni elevate ed efficiente in termini di costi per addestrare e implementare modelli più grandi e sofisticati per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.

Le istanze G5 sono dotate di un massimo di 8 processori NVIDIA e AMD EPYC di seconda generazione. Supportano inoltre fino a 192 vCPU, fino a 100 Gbps di larghezza di banda della rete e fino a 7,6 TB di archiviazione SSD NVMe locale.

Vantaggi

Le istanze G5 offrono prestazioni grafiche fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore rispetto alle istanze G4dn. Hanno più core di ray tracing rispetto a qualsiasi altra istanza EC2 basata su GPU, dispongono di 24 GB di memoria per GPU e supportano la tecnologia NVIDIA RTX. Per questo sono ideali per effettuare il rendering di scene realistiche in modo più rapido, eseguire potenti postazioni di lavoro virtuali e supportare applicazioni grafiche complesse con una maggiore fedeltà.

Le istanze G5 offrono prestazioni fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore per l'inferenza di machine learning rispetto alle istanze G4dn. Sono una soluzione altamente performante ed economica per i clienti che desiderano utilizzare librerie NVIDIA come TensorRT, CUDA e cuDNN per eseguire le proprie applicazioni di machine learning.

Le istanze G5 offrono di costi di addestramento inferiori fino al 15% rispetto alle istanze P3 di Amazon EC2. Offrono inoltre prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn. Per questo motivo sono una soluzione conveniente per l'addestramento di modelli di machine learning moderatamente complessi e a nodo singolo per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.

Le istanze G5 si basano sull'AWS Nitro System, una combinazione di hardware dedicato e hypervisor leggero che fornisce tutte le risorse di elaborazione e di memoria dell'hardware host alle istanze per prestazioni e sicurezza complessive migliori. Con le istanze G5, il sistema Nitro fornisce le GPU in modalità pass-through, fornendo prestazioni paragonabili a quelle del bare metal.

Caratteristiche

Le istanze G5 sono le prime nel cloud a utilizzare GPU NVIDIA A10G Tensor Core che offrono prestazioni elevate per applicazioni di machine learning e ad alta intensità di grafica. Ogni istanza include fino a 8 GPU A10G Tensor Core dotate di 80 core di ray tracing e 24 GB di memoria per GPU. Presentano anche 320 NVIDIA Tensor Core di terza generazione che offrono fino a 250 TOPS con prestazioni elevate per i carichi di lavoro di ML.

Le istanze G5 offrono ai clienti driver NVIDIA RTX Enterprise e gaming senza costi aggiuntivi. I driver NVIDIA RTX Enterprise possono essere usati per fornire workstation virtuali di alta qualità per un'ampia gamma di flussi di lavoro ad alta intensità grafica. I driver di gaming NVIDIA forniscono grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi. Le istanze G5 supportano anche le librerie CUDA, cuDNN, NVENC, TensorRT, cuBLas, OpenCL, DirectX 11/12, Vulkan 1.1 e OpenGL 4.5.

Le istanze G5 sono dotate di una velocità di trasmissione effettiva della rete fino a 100 Gbps, che consente loro di supportare le esigenze di bassa latenza dell'inferenza di machine learning e delle applicazioni ad alta intensità grafica. Grazie a 24 GB di memoria per GPU e la capacità di supportare fino a 7,6 TB di storage SSD NVMe locale, consentono l'archiviazione locale di modelli e set di dati di grandi dimensioni per l'addestramento e l'inferenza di machine learning a prestazioni elevate. Le istanze G5 possono anche archiviare file video di grandi dimensioni in locale, con un conseguente aumento delle prestazioni grafiche e della capacità di eseguire il rendering di file video più grandi e complessi.

Le istanze G5 sono basate su AWS Nitro System, che è una ricca raccolta di blocchi costitutivi che consente di scaricare molte delle tradizionali funzioni di virtualizzazione su hardware e software dedicati per offrire elevate prestazioni, alta disponibilità e alta sicurezza riducendo al contempo il sovraccarico della virtualizzazione.

Dettagli prodotto

Instance Size
GPU
GPU Memory (GiB)
vCPUs
Memory (GiB)
Storage (GB)
Network Bandwidth (Gbps)
EBS Bandwidth (Gbps)
VM a GPU singola

g5.xlarge

g5.2xlarge

g5.4xlarge

g5.8xlarge

g5.16xlarge

1

1

1

1

1

24

24

24

24

24

4

8

16

32

64

16

32

64

128

256

1x250

1x450

1x600

1x900

1x1900

Fino a 10

Fino a 10

Fino a 25

25

25

Fino a 3,5

Fino a 3,5

8

16

16

VM a GPU multiple

g5.12xlarge

g5.24xlarge

g5.48xlarge

4

4

8

96

96

192

48

96

192

192

384

768

1x3800

1x3800

2x3800

40

50

100

16

19

19

Atenascopio

Athenascope sfrutta gli ultimi sviluppi nel campo della visione artificiale e dell'intelligenza artificiale per analizzare il gameplay, individuare automaticamente i momenti più avvincenti dei giochi e creare video salienti per videogiocatori e creatori di contenuti. 

Il nostro obiettivo è creare un'esperienza video fluida, e a tale scopo è fondamentale utilizzare i nostri modelli di CV per ottenere un'analisi video a bassa latenza. Le istanze Amazon EC2 G5 offrono un rapporto prezzo/prestazioni del 30% migliore rispetto alle precedenti implementazioni con istanze G4dn.

Chris Kirmse, CEO & Founder di Athenascope

Missing alt text value

Netflix

Netflix è uno dei principali servizi di intrattenimento in streaming al mondo, con oltre 214 milioni di abbonati in più di 190 Paesi che possono fruire di serie TV, documentari e lungometraggi in un'ampia varietà di generi e lingue.  

Grazie alle nuove istanze G5 di Amazon EC2, possiamo effettuare il provisioning di workstation grafiche di gamma elevata che offrono prestazioni fino a 3 volte superiori rispetto alle workstation con istanze G4dn di EC2. Con le istanze G5, i creatori hanno la possibilità di creare contenuti in modo più complesso e realistico per gli spettatori.

Ben Tucker, Technical Lead, Animation Production Systems Engineering presso Netflix

Missing alt text value

Varjo

Per le applicazioni VR/XR di fascia alta, le istanze Amazon EC2 G5 sono rivoluzionarie. Siamo in grado di eseguire applicazioni professionali con la risoluzione tipica di Varjo, che raggiunge i livelli dell'occhio umano, con una frequenza di fotogrammi tre volte superiore rispetto alle istanze G4dn utilizzate in precedenza, offrendo ai nostri clienti un'esperienza di qualità ineguagliata durante lo streaming dal server.

Urho Konttori, fondatore e Chief Technology Officer presso Varjo

Missing alt text value

Nozioni di base sulle istanze G5

Le DLAMI forniscono ai ricercatori e agli esperti di ML l'infrastruttura e gli strumenti nel cloud necessari per velocizzare i processi di DL su qualsiasi scala. I Container per il Deep Learning, immagini Docker preinstallate con framework di DL, semplificano l'implementazione degli ambienti di ML personalizzati poiché consentono di saltare il complicato processo di creazione e ottimizzazione degli ambienti ex novo.

Se preferisci gestire i tuoi carichi di lavoro containerizzati tramite i servizi di orchestrazione dei container, puoi implementare le istanze G5 con Amazon EKS o Amazon ECS.

Puoi utilizzare varie immagini Amazon Machine Images (AMI) offerte da AWS e NVIDIA, fornite con i driver NVIDIA installati.

Puoi distribuire modelli ML su istanze G5 utilizzando Amazon SageMaker, il servizio completamente gestito per la creazione, l'addestramento e la distribuzione di modelli ML.