Istanze G5 di Amazon EC2

Istanze basate su GPU ad alte prestazioni per applicazioni ad alta intensità grafica e inferenze di machine learning

Le istanze G5 di Amazon EC2 sono l'ultima generazione di istanze basate su GPU NVIDIA che possono essere utilizzate per un'ampia gamma di casi d'uso di grafica intensiva e machine learning. Offrono prestazioni fino a 3 volte migliori per applicazioni ad alta intensità grafica e inferenze di machine learning e prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn di Amazon EC2.

I clienti possono utilizzare le applicazioni G5 ad alta intensità grafica come stazioni di lavoro remote, rendering video e gaming per produrre grafiche ad alta fedeltà in tempo reale. Con le istanze G5, i clienti del machine learning ottengono un'infrastruttura a prestazioni elevate ed efficiente in termini di costi per addestrare e implementare modelli più grandi e sofisticati per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.

Le istanze G5 hanno fino a 8 GPU NVIDIA A10G Tensor Core e processori AMD EPYC di seconda generazione. Supportano inoltre fino a 192 vCPU, fino a 100 Gbps di larghezza di banda della rete e fino a 7,6 TB di archiviazione SSD NVMe locale.

Nuove istanze G5 di Amazon EC2 (1:20)

Vantaggi

Alte prestazioni per applicazioni ad alta intensità di grafica

Le istanze G5 offrono prestazioni grafiche fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore rispetto alle istanze G4dn. Hanno più core di ray tracing rispetto a qualsiasi altra istanza EC2 basata su GPU, dispongono di 24 GB di memoria per GPU e supportano la tecnologia NVIDIA RTX. Per questo sono ideali per effettuare il rendering di scene realistiche in modo più rapido, eseguire potenti postazioni di lavoro virtuali e supportare applicazioni grafiche complesse con una maggiore fedeltà.

Alte prestazioni ed efficienza in termini di costi per l'inferenza di ML

Le istanze G5 offrono prestazioni fino a 3 volte superiori e un rapporto qualità-prezzo fino al 40% migliore per l'inferenza di machine learning rispetto alle istanze G4dn. Sono una soluzione altamente performante ed economica per i clienti che desiderano utilizzare librerie NVIDIA come TensorRT, CUDA e cuDNN per eseguire le proprie applicazioni di machine learning.

Addestramento efficiente in termini di costi per modelli di ML moderatamente complessi

Le istanze G5 offrono di costi di addestramento inferiori fino al 15% rispetto alle istanze P3 di Amazon EC2. Offrono inoltre prestazioni fino a 3,3 volte superiori per l'addestramento del machine learning rispetto alle istanze G4dn. Per questo motivo sono una soluzione conveniente per l'addestramento di modelli di machine learning moderatamente complessi e a nodo singolo per casi d'uso quali l'elaborazione del linguaggio naturale, la visione artificiale e i motori di suggerimento.

Efficienza delle risorse massimizzata

Le istanze G5 si basano sull'AWS Nitro System, una combinazione di hardware dedicato e hypervisor leggero che fornisce tutte le risorse di elaborazione e di memoria dell'hardware host alle istanze per prestazioni e sicurezza complessive migliori. Con le istanze G5, il sistema Nitro fornisce le GPU in modalità pass-through, fornendo prestazioni paragonabili a quelle del bare metal.

Caratteristiche

GPU AWS NVIDIA A10G Tensor Core

Le istanze G5 sono le prime nel cloud a utilizzare GPU NVIDIA A10G Tensor Core che offrono prestazioni elevate per applicazioni di machine learning e ad alta intensità di grafica. Ogni istanza include fino a 8 GPU A10G Tensor Core dotate di 80 core di ray tracing e 24 GB di memoria per GPU. Presentano anche 320 NVIDIA Tensor Core di terza generazione che offrono fino a 250 TOPS con prestazioni elevate per i carichi di lavoro di ML.

Driver NVIDIA

Le istanze G5 offrono ai clienti driver NVIDIA RTX Enterprise e gaming senza costi aggiuntivi. I driver NVIDIA RTX Enterprise possono essere usati per fornire workstation virtuali di alta qualità per un'ampia gamma di flussi di lavoro ad alta intensità grafica. I driver di gaming NVIDIA forniscono grafica senza precedenti e supporto di elaborazione per lo sviluppo di giochi. Le istanze G5 supportano anche le librerie CUDA, cuDNN, NVENC, TensorRT, cuBLas, OpenCL, DirectX 11/12, Vulkan 1.1 e OpenGL 4.5.

Reti e storage ad alte prestazioni

Le istanze G5 sono dotate di una velocità di trasmissione effettiva della rete fino a 100 Gbps, che consente loro di supportare le esigenze di bassa latenza dell'inferenza di machine learning e delle applicazioni ad alta intensità grafica. Grazie a 24 GB di memoria per GPU e la capacità di supportare fino a 7,6 TB di storage SSD NVMe locale, consentono l'archiviazione locale di modelli e set di dati di grandi dimensioni per l'addestramento e l'inferenza di machine learning a prestazioni elevate. Le istanze G5 possono anche archiviare file video di grandi dimensioni in locale, con un conseguente aumento delle prestazioni grafiche e della capacità di eseguire il rendering di file video più grandi e complessi.

Basate su AWS Nitro System

Le istanze G5 sono basate su AWS Nitro System, che è una ricca raccolta di blocchi costitutivi che consente di scaricare molte delle tradizionali funzioni di virtualizzazione su hardware e software dedicati per offrire elevate prestazioni, alta disponibilità e alta sicurezza riducendo al contempo il sovraccarico della virtualizzazione.

Dettagli del prodotto

  Dimensioni istanza GPU Memoria GPU (GiB) vCPU Memoria (GiB) Archiviazione (GB) Larghezza di banda di rete (Gbps) Larghezza di banda EBS (Gb/s) Prezzo on demand/h* Prezzo all'ora effettivo per 1 anno di ISP (Linux) Prezzo all'ora effettivo per 3 anni di ISP (Linux)
VM a GPU singola g5.xlarge 1 24 4 16 1x250 Fino a 10 Fino a 3,5 1,006 USD 0,604 USD 0,402 USD
g5.2xlarge 1 24 8 32 1x450 Fino a 10 Fino a 3,5 1,212 USD 0,727 USD 0,485 USD
g5.4xlarge 1 24 16 64 1x600 Fino a 25 8 1,624 USD 0,974 USD 0,650 USD
g5.8xlarge 1 24 32 128 1x900 25 16 2,448 USD 1,469 USD 0,979 USD
g5.16xlarge 1 24 64 256 1x1900 25 16 4,096 USD 2,458 USD 1,638 USD
                       
VM a GPU multiple g5.12xlarge 4 96 48 192 1x3800 40 16 5,672 USD 3,403 USD 2,269 USD
g5.24xlarge 4 96 96 384 1x3800 50 19 8,144 USD 4,886 USD 3,258 USD
g5.48xlarge 8 192 192 768 2x3800 100 19 16,288 USD 9,773 USD 6,515 USD

*I prezzi sono calcolati per la Regione AWS Stati Uniti orientali (Virginia settentrionale). Per quanto riguarda le istanze che non prevedono pagamenti anticipati parziali, i prezzi per le istanze riservate di 1 anno e di 3 anni si applicano alle opzioni di pagamento "parzialmente anticipato" o "nessun anticipo".

Testimonianze dei clienti

Logo Athenascope

Athenascope sfrutta gli ultimi sviluppi nel campo della visione artificiale e dell'intelligenza artificiale per analizzare il gameplay, individuare automaticamente i momenti più avvincenti dei giochi e creare video salienti per videogiocatori e creatori di contenuti.

"Usare i nostri modelli di CV per ottenere un'analisi video a bassa latenza è un obiettivo fondamentale volto a creare un'esperienza video fluida. Le istanze G5 di Amazon EC2 offrono un miglioramento del 30% nel rapporto prezzo/prestazioni rispetto alle precedenti implementazioni con istanze G4dn".

Chris Kirmse, CEO & Founder di Athenascope

Netflix

Netflix è uno dei principali servizi di intrattenimento in streaming al mondo, con oltre 214 milioni di abbonati in più di 190 Paesi che possono fruire di serie TV, documentari e lungometraggi in un'ampia varietà di generi e lingue. 

"Costruire uno studio nel cloud per creare animazioni, effetti visivi e contenuti live action per i nostri spettatori è una priorità per noi. Desideriamo dare agli artisti la flessibilità di accedere alle postazioni di lavoro quando e dove ne hanno bisogno. Siamo costantemente alla ricerca di modi per aiutare i nostri artisti a innovarsi offrendo loro l'accesso a postazioni di lavoro più potenti".

Stephen Kowalski, Director of Digital Production Infrastructure Engineering di Netflix

"Grazie alle nuove istanze G5 di Amazon EC2, possiamo effettuare il provisioning di workstation grafiche di gamma elevata che offrono prestazioni fino a 3 volte superiori rispetto alle workstation con istanze G4dn di EC2. Con le istanze G5, i creatori di contenuti hanno la possibilità di creare in modo più complesso e realistico per i nostri visualizzatori".

Ben Tucker, Technical Lead, Animation Production Systems Engineering di Netflix

Varjo
"Per le applicazioni VR/XR di fascia alta, le istanze Amazon EC2 G5 sono rivoluzionarie. Siamo in grado di eseguire applicazioni professionali con la risoluzione tipica di Varjo, che raggiunge i livelli dell'occhio umano, con una frequenza di fotogrammi tre volte superiore rispetto alle istanze G4dn utilizzate in precedenza, offrendo ai nostri clienti un'esperienza di qualità ineguagliata durante lo streaming dal server". 

Urho Konttori, Founder and Chief Technology Officer di Varjo

Leggi il caso di studio »

Nozioni di base

Gli AWS Deep Learning AMI (DLAMI) e gli AWS Deep Learning Containers (DLC)

Gli AWS Deep Learning AMI (DLAMI) e AWS Deep Learning Containers (DLC) forniscono ai Data Scientist, a chi lavora con il ML e ai ricercatori le macchine e le immagini container preinstallate nei framework di Deep Learning per semplificare l'inizio facendoti saltare il complicato processo di creazione e ottimizzazione dei tuoi ambienti software da zero. Il SynapseAI SDK per i Gaudi Accelerator è integrato nei DL AMI e nei DLC di AWS permettendoti di iniziare velocemente a utilizzare le istanze DL1.

Amazon Elastic Kubernetes Service (EKS) o Elastic Container Service (ECS)

I clienti che preferiscono gestire i propri carichi di lavoro containerizzati tramite i servizi di orchestrazione dei container possono distribuire istanze DL1 con Amazon EKS o ECS.

Risorse aggiuntive

Demo: addestrare modelli di deep learning con le istanze DL1 di Amazon EC2 (2:03)
Presentazione di Amazon EC2 DL1 Instances (3:41)
Confronto dei costi di addestramento delle istanze DL1 di Amazon EC2 (0:50)
Iniziare facilmente a usare le istanze DL1 di Amazon EC2 (0:49)

Documentazione Habana® Gaudi® v0.15

Consulta la documentazione »

Forum per sviluppatori Habana®

Visita il forum »

Repository GitHub di Habana®

Visita GitHub »

Risorse

Datasheet

GPU tensor core NVIDIA A10G: elaborazione e grafica accelerate per il cloud AWS

Nozioni di base su AWS

Registrati per creare un account AWS

Registrati per creare un account AWS

Ottieni accesso istantaneo al piano gratuito di AWS.

Impara con semplici tutorial

Impara con i tutorial di 10 minuti

Esplora e impara con semplici tutorial.

Inizia a lavorare con EC2 nella console

Inizia a lavorare nella console

Inizia a creare seguendo le istruzioni contenute nelle guide dettagliate per avviare un progetto AWS.