Le istanze Amazon EC2 P5e sono generalmente disponibili tramite blocchi di capacità EC2

Inserito il: 9 set 2024

Oggi AWS rende disponibili per tutti le istanze P5e di Amazon Elastic Compute Cloud (Amazon EC2), alimentate dalle più recenti versioni di GPU NVIDIA H200 Tensor Core. I blocchi di capacità sono disponibili tramite EC2; queste istanze offrono le massime prestazioni in Amazon EC2 per il deep learning e l'inferenza di IA generativa.

Puoi utilizzare le istanze Amazon EC2 P5 per addestrare e implementare modelli linguistici di grandi dimensioni (LLM) e modelli di diffusione sempre più complessi che sono alla base delle applicazioni di IA generativa più esigenti. Puoi utilizzare le istanze P5e anche per implementare applicazioni HPC impegnative su larga scala per la scoperta farmaceutica, l'analisi sismica, le previsioni meteorologiche e la modellazione finanziaria.

Le istanze P5e sono dotate di 8 GPU H200 con una dimensione di memoria GPU 1,7x e una larghezza di banda di memoria GPU 1,5x rispetto alle GPU H100 presenti nelle istanze P5. Offrono funzionalità di scalabilità all'avanguardia per l'addestramento distribuito e i carichi di lavoro HPC strettamente accoppiati con un massimo di 3.200 Gb/s di rete utilizzando Elastic Fabric Adapter (EFA) di seconda generazione. Per soddisfare le esigenze dei clienti su larga scala a bassa latenza, le istanze P5e vengono implementate in Amazon EC2 UltraClusters.

Le istanze P5e sono ora disponibili nella regione AWS degli Stati Uniti orientali (Ohio) nelle dimensioni p5e.48xlarge tramite i blocchi di capacità EC2 per ML.

Per ulteriori informazioni sulle istanze P5e, consulta le istanze Amazon EC2 P5e.