Le istanze Amazon EC2 P5en sono attualmente disponibili nella Regione AWS Stati Uniti occidentali (California settentrionale).
Da oggi le istanze Amazon Elastic Compute Cloud (Amazon EC2) P5en, basate su GPU NVIDIA H200, sono disponibili nella Regione AWS Stati Uniti occidentali (California settentrionale). Ottimizzate per applicazioni di IA generativa e calcolo ad alte prestazioni (HPC),
le istanze P5en offrono 8 GPU H200 con una memoria 1,7 volte più grande e una larghezza di banda della memoria 1,4 volte superiore rispetto alle GPU H100 delle istanze P5. Le istanze P5en abbinano le GPU H200 a processori scalabili Intel Xeon personalizzati di quarta generazione ad alte prestazioni, consentendo l'uso di PCIe Gen5 tra CPU e GPU, che fornisce una larghezza di banda fino a 4 volte superiore tra CPU e GPU e aumenta le prestazioni di addestramento e inferenza dell'intelligenza artificiale. Le istanze P5en, con un massimo di 3200 Gbps di EFA di terza generazione che utilizza Nitro v5, mostrano un miglioramento della latenza fino al 35% rispetto alle istanze P5 che utilizzano la generazione precedente di EFA e Nitro. Ciò migliora le prestazioni delle comunicazioni collettive per carichi di lavoro di addestramento distribuito come deep learning, IA generativa, elaborazione dei dati in tempo reale e applicazioni di calcolo ad alte prestazioni (HPC). Per soddisfare le esigenze dei clienti su larga scala a bassa latenza, le istanze P5en vengono distribuite in Amazon EC2 UltraCluster e offrono funzionalità di scalabilità orizzontale leader di mercato per l'addestramento distribuito e carichi di lavoro HPC strettamente accoppiati.
Per ulteriori informazioni sulle istanze P5en, consulta Istanze P5en di Amazon EC2.