Le istanze Amazon EC2 P5en, ottimizzate per IA generativa e HPC, sono ora disponibili al pubblico

Inserito il: 2 dic 2024

Oggi AWS rende disponibili per tutti le istanze P5en di Amazon Elastic Compute Cloud (Amazon EC2), alimentate dalle più recenti versioni di GPU NVIDIA H200 Tensor Core. Queste istanze offrono le massime prestazioni in Amazon EC2 per applicazioni di deep learning e calcolo ad alte prestazioni (HPC).

Puoi utilizzare le istanze Amazon EC2 P5en per addestrare e implementare modelli linguistici di grandi dimensioni (LLM) e modelli di diffusione sempre più complessi che sono alla base delle applicazioni di IA generativa più esigenti. Puoi utilizzare le istanze P5en anche per implementare applicazioni HPC impegnative su larga scala per la scoperta farmaceutica, l'analisi sismica, le previsioni meteorologiche e la modellazione finanziaria.

Le istanze P5en sono dotate di un massimo di 8 GPU H200 con una dimensione di memoria GPU 1,7x e una larghezza di banda di memoria GPU 1,5x rispetto alle GPU H100 presenti nelle istanze P5. Le istanze P5en abbinano le GPU H200 a processori scalabili Intel Xeon personalizzati di quarta generazione ad alte prestazioni, consentendo l'uso di PCIe Gen5 tra CPU e GPU, che fornisce una larghezza di banda fino a 4 volte superiore tra CPU e GPU e aumenta le prestazioni di addestramento e inferenza dell'intelligenza artificiale. Le istanze P5en, con un massimo di 3200 Gbps di EFA di terza generazione che utilizza Nitro v5, mostrano un miglioramento della latenza fino al 35% rispetto alle istanze P5 che utilizzano la generazione precedente di EFA e Nitro. Ciò migliora le prestazioni delle comunicazioni collettive per carichi di lavoro di addestramento distribuito come deep learning, IA generativa, elaborazione dei dati in tempo reale e applicazioni di calcolo ad alte prestazioni (HPC). Per soddisfare le esigenze dei clienti su larga scala a bassa latenza, le istanze P5en vengono distribuite in Amazon EC2 UltraCluster e offrono funzionalità di scalabilità orizzontale leader di mercato per l'addestramento distribuito e carichi di lavoro HPC strettamente accoppiati.

Le istanze P5en sono ora disponibili nelle regioni AWS Stati Uniti orientali (Ohio), Stati Uniti occidentali (Oregon) e Asia Pacifico (Tokyo) e nella zona locale Stati Uniti orientali (Atlanta) us-east-1-atl-2a nella dimensione p5en.48xlarge.

Per ulteriori informazioni sulle istanze P5en, consulta Istanze P5en di Amazon EC2.