Amazon EC2

Istanze G5 di Amazon EC2

Istanze basate su GPU ad alte prestazioni per applicazioni ad alta intensità grafica e inferenze di machine learning

Inizia a usare le istanze G5

Perché scegliere le istanze G5 di Amazon EC2?

Le istanze G5 di Amazon EC2 sono la generazione più recente di istanze basate su GPU NVIDIA che possono essere utilizzate per un'ampia gamma di casi d'uso di grafica intensiva e machine learning. Offrono prestazioni fino a 3 volte migliori per applicazioni ad alta intensità grafica e inferenze di machine learning e prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn di Amazon EC2.

I clienti possono utilizzare le applicazioni G5 ad alta intensità grafica come stazioni di lavoro remote, rendering video e gaming per produrre grafiche ad alta fedeltà in tempo reale. Con le istanze G5, i clienti del machine learning ottengono un'infrastruttura a prestazioni elevate ed efficiente in termini di costi per addestrare e implementare modelli più grandi e sofisticati per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.

Le istanze G5 sono dotate di un massimo di 8 processori NVIDIA e AMD EPYC di seconda generazione. Supportano, inoltre, fino a 192 vCPU, fino a 100 Gbps di larghezza di banda della rete e fino a 7,6 TB di archiviazione SSD NVMe locale.

Vantaggi

Le istanze G5 offrono prestazioni grafiche fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore rispetto alle istanze G4dn. Hanno più core di ray tracing rispetto a qualsiasi altra istanza EC2 basata su GPU, dispongono di 24 GB di memoria per GPU e supportano la tecnologia NVIDIA RTX. Per questo sono ideali per effettuare il rendering di scene realistiche in modo più rapido, eseguire potenti postazioni di lavoro virtuali e supportare applicazioni grafiche complesse con una maggiore fedeltà.

Le istanze G5 offrono prestazioni fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore per l'inferenza di machine learning rispetto alle istanze G4dn. Sono una soluzione altamente performante ed economica per i clienti che desiderano utilizzare librerie NVIDIA come TensorRT, CUDA e cuDNN per eseguire le proprie applicazioni di machine learning.

Le istanze G5 offrono di costi di addestramento inferiori fino al 15% rispetto alle istanze P3 di Amazon EC2. Offrono inoltre prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn. Per questo motivo sono una soluzione conveniente per l'addestramento di modelli di machine learning moderatamente complessi e a nodo singolo per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.

Le istanze G5 si basano su AWS Nitro System, una combinazione di hardware dedicato e hypervisor leggero che fornisce tutte le risorse di elaborazione e di memoria dell'hardware host alle istanze per prestazioni e sicurezza complessive migliori. Con le istanze G5, il sistema Nitro fornisce le GPU in modalità pass-through, fornendo prestazioni paragonabili a quelle del bare metal.

Caratteristiche

Le istanze G5 sono le prime nel cloud a utilizzare GPU NVIDIA A10G Tensor Core che offrono prestazioni elevate per applicazioni di machine learning e ad alta intensità di grafica. Ogni istanza include fino a 8 GPU A10G Tensor Core dotate di 80 core di ray tracing e 24 GB di memoria per GPU. Presentano anche 320 NVIDIA Tensor Core di terza generazione che offrono fino a 250 TOPS con prestazioni elevate per i carichi di lavoro di ML.

Le istanze G5 offrono ai clienti driver NVIDIA RTX Enterprise e gaming senza costi aggiuntivi. I driver NVIDIA RTX Enterprise possono essere usati per fornire workstation virtuali di alta qualità per un'ampia gamma di flussi di lavoro ad alta intensità grafica. I driver di gaming NVIDIA forniscono grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi. Le istanze G5 supportano anche le librerie CUDA, cuDNN, NVENC, TensorRT, cuBLAS, OpenCL, DirectX 11/12, Vulkan 1.1 e OpenGL 4.5.

Le istanze G5 sono dotate di una velocità di throughput della rete fino a 100 Gbps, che consente loro di supportare le esigenze di bassa latenza dell'inferenza di machine learning e delle applicazioni ad alta intensità grafica. Grazie a 24 GB di memoria per GPU e la capacità di supportare fino a 7,6 TB di storage SSD NVMe locale, consentono l'archiviazione locale di modelli e set di dati di grandi dimensioni per l'addestramento e l'inferenza di machine learning a prestazioni elevate. Le istanze G5 possono anche archiviare file video di grandi dimensioni in locale, con un conseguente aumento delle prestazioni grafiche e della capacità di eseguire il rendering di file video più grandi e complessi.

Le istanze G5 sono basate su AWS Nitro System, che è una ricca raccolta di blocchi costitutivi che consente di scaricare molte delle tradizionali funzioni di virtualizzazione su hardware e software dedicati per offrire elevate prestazioni, alta disponibilità e alta sicurezza riducendo al contempo il sovraccarico della virtualizzazione.

Dettagli del prodotto

Dimensioni istanza

GPU

Memoria GPU (GiB)

vCPU

Memoria (GiB)

Archiviazione (GB)

Larghezza di banda della rete (Gbps)

Larghezza di banda EBS (Gbps)

VM a GPU singola

g5.xlarge

g5.2xlarge

g5.4xlarge

g5.8xlarge

g5.16xlarge

128

256

1x250

1x450

1x600

1x900

1x1900

Fino a 10

Fino a 25

Fino a 3,5

VM a GPU multiple

g5.12xlarge

g5.24xlarge

g5.48xlarge

192

384

768

1x3800

2x3800

100

Athenascope

Athenascope sfrutta gli ultimi sviluppi nel campo della visione artificiale e dell'intelligenza artificiale per analizzare il gameplay, individuare automaticamente i momenti più avvincenti dei giochi e creare video salienti per videogiocatori e creatori di contenuti.

“Il nostro obiettivo è creare un'esperienza video fluida, e a tale scopo è fondamentale utilizzare i nostri modelli di CV per ottenere un'analisi video a bassa latenza. Le istanze G5 di Amazon EC2 offrono un rapporto prezzo/prestazioni del 30% migliore rispetto alle precedenti distribuzioni con istanze G4dn.”

Chris Kirmse, CEO & Founder presso Athenascope

Netflix

Netflix è uno dei principali servizi di intrattenimento in streaming al mondo, con oltre 214 milioni di abbonati in più di 190 Paesi che possono fruire di serie TV, documentari e lungometraggi in un'ampia varietà di generi e lingue.

“Grazie alle nuove istanze G5 di Amazon EC2, possiamo effettuare il provisioning di workstation grafiche di gamma elevata che offrono prestazioni fino a 3 volte superiori rispetto alle workstation con istanze G4dn di EC2. Con le istanze G5, i creatori hanno la possibilità di creare contenuti in modo più complesso e realistico per gli spettatori.”

Ben Tucker, Technical Lead, Animation Production Systems Engineering presso Netflix

Varjo

“Per le applicazioni VR/XR di fascia alta, le istanze G5 di Amazon EC2 sono rivoluzionarie. Siamo in grado di eseguire applicazioni professionali con la risoluzione tipica di Varjo, che raggiunge i livelli dell'occhio umano, con una frequenza di fotogrammi tre volte superiore rispetto alle istanze G4dn utilizzate in precedenza, offrendo ai nostri clienti un'esperienza di qualità ineguagliata durante lo streaming dal server.”

Urho Konttori, Founder e Chief Technology Officer presso Varjo

Leggi il caso di studio

Nozioni di base sulle istanze G5

DLAMI fornisce ai ricercatori e agli esperti di ML l'infrastruttura e gli strumenti nel cloud necessari per velocizzare i processi di DL su qualsiasi scala. I Container per il Deep Learning, immagini Docker preinstallate con framework di DL, semplificano l'implementazione degli ambienti di ML personalizzati poiché consentono di saltare il complicato processo di creazione e ottimizzazione degli ambienti ex novo.

Se preferisci gestire i carichi di lavoro containerizzati tramite i servizi di orchestrazione di container, è possibile distribuire le istanze G5 con Amazon EKS o Amazon ECS.

È possibile utilizzare varie immagini Amazon Machine Images (AMI) offerte da AWS e NVIDIA, fornite con i driver NVIDIA installati.

È possibile distribuire modelli ML su istanze G5 utilizzando Amazon SageMaker, il servizio completamente gestito per la creazione, l'addestramento e la distribuzione di modelli ML.

Nozioni di base su AWS

Fase 1: Registrati per creare un account AWS

Ottieni l'accesso immediato al piano gratuito AWS.

Ulteriori informazioni

Fase 2: Impara con i tutorial di 10 minuti

Esplora e impara con semplici tutorial.

Ulteriori informazioni

Fase 3: Inizia a creare con AWS

Inizia a creare con le guide dettagliate che ti aiutano a lanciare il tuo progetto AWS.

Ulteriori informazioni

Istanze G5 di Amazon EC2

Perché scegliere le istanze G5 di Amazon EC2?

Vantaggi

Caratteristiche

Dettagli del prodotto

Athenascope

Netflix

Varjo

Nozioni di base sulle istanze G5

Nozioni di base su AWS

Fase 1: Registrati per creare un account AWS

Fase 2: Impara con i tutorial di 10 minuti

Fase 3: Inizia a creare con AWS

Scopri

Risorse

Sviluppatori

Assistenza

Istanze G5 di Amazon EC2

Perché scegliere le istanze G5 di Amazon EC2?

Vantaggi

Alte prestazioni per applicazioni ad alta intensità di grafica

Alte prestazioni ed efficienza in termini di costi per l'inferenza di ML

Addestramento efficiente in termini di costi per modelli di ML moderatamente complessi

Efficienza delle risorse massimizzata

Caratteristiche

GPU AWS NVIDIA A10G Tensor Core

Driver NVIDIA

Reti e archiviazione ad alte prestazioni

Basate su AWS Nitro System

Dettagli del prodotto

Athenascope

Netflix

Varjo

Nozioni di base sulle istanze G5

Utilizzo di DLAMI o Container per il Deep Learning

Utilizzo di Amazon EKS o Amazon ECS

Utilizzo di AMI per carichi di lavoro grafici

Utilizzo di SageMaker per carichi di lavoro ML

Nozioni di base su AWS

Fase 1: Registrati per creare un account AWS

Fase 2: Impara con i tutorial di 10 minuti

Fase 3: Inizia a creare con AWS

Scopri

Risorse

Sviluppatori

Assistenza