Las instancias P5en de Amazon EC2, optimizadas para la IA generativa y la HPC, están disponibles a nivel general
Hoy, AWS anuncia la disponibilidad general de las instancias P5en de Amazon Elastic Compute Cloud (Amazon EC2), que funcionan con las últimas GPU NVIDIA H200 con Tensor Core. Estas instancias ofrecen el mayor rendimiento de Amazon EC2 para aplicaciones de aprendizaje profundo e informática de alto rendimiento (HPC).
Puede usar las instancias P5en de Amazon EC2 para entrenar e implementar modelos de lenguaje de gran tamaño (LLM) y modelos de difusión cada vez más complejos que impulsan las aplicaciones de IA generativa más exigentes. También puede usar las instancias P5en para implementar aplicaciones exigentes de HPC a escala en el descubrimiento farmacéutico, el análisis sísmico, la previsión meteorológica y la modelización financiera.
Las instancias P5en cuentan con hasta 8 GPU H200 que tienen un tamaño de memoria GPU 1,7 veces mayor y un ancho de banda de memoria GPU 1,5 veces mayor que las GPU H100 incluidas en las instancias P5. Las instancias P5en combinan las GPU H200 con procesadores escalables Intel Xeon de cuarta generación personalizados de alto rendimiento, lo que permite utilizar PCIe Gen5 entre la CPU y la GPU, lo que proporciona hasta 4 veces más ancho de banda entre la CPU y la GPU y aumenta el rendimiento de inferencia y entrenamiento de la IA. El P5en, con hasta 3200 Gbps de tercera generación de EFA que utiliza Nitro v5, muestra una mejora de la latencia de hasta un 35 % en comparación con el P5, que utiliza la generación anterior de EFA y Nitro. Esto ayuda a mejorar el rendimiento de las comunicaciones colectivas para cargas de trabajo de entrenamiento distribuido, como el aprendizaje profundo, la IA generativa, el procesamiento de datos en tiempo real y las aplicaciones de computación de alto rendimiento (HPC). Para satisfacer las necesidades de los clientes de una gran escala con baja latencia, las instancias P5en se implementan en los UltraClusters de Amazon EC2 y proporcionan capacidades de escalado horizontal líderes del mercado para la capacitación distribuida y las cargas de trabajo de HPC estrechamente acopladas.
Las instancias P5en ya están disponibles en las regiones de AWS del Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón) y Asia Pacífico (Tokio) y en la zona local del Este de EE. UU. (Atlanta) us-east-1-atl-2a en el tamaño p5en.48xlarge.
Para obtener más información, consulte el documento Instancias P5en de Amazon EC2.