Las instancias P5en de Amazon EC2 ya están disponibles en las regiones este de EE. UU. (norte de Virginia) y Asia-Pacífico (Yakarta)
A partir de hoy, las instancias P5en de Amazon Elastic Compute Cloud (Amazon EC2) con GPU NVIDIA H200 están disponibles en las regiones de AWS este de EE. UU. (norte de Virginia) y Asia-Pacífico (Yakarta). Estas instancias están optimizadas para aplicaciones de IA generativa y computación de alto rendimiento (HPC).
Las instancias P5en cuentan con 8 GPU H200 que tienen un tamaño de memoria GPU 1,7 veces mayor y un ancho de banda de memoria de GPU 1,4 veces mayor que las GPU H100 incluidas en las instancias P5. Las instancias P5en combinan las GPU H200 con procesadores escalables Intel Xeon de cuarta generación personalizados de alto rendimiento, lo que permite utilizar PCIe Gen5 entre la CPU y la GPU, lo que proporciona hasta 4 veces más ancho de banda entre la CPU y la GPU y aumenta el rendimiento de inferencia y entrenamiento de la IA. El P5en, con hasta 3200 Gbps de tercera generación de EFA que utiliza Nitro v5, muestra una mejora de la latencia de hasta un 35 % en comparación con el P5, que utiliza la generación anterior de EFA y Nitro. Esto ayuda a mejorar el rendimiento de las comunicaciones colectivas para cargas de trabajo de entrenamiento distribuido, como el aprendizaje profundo, la IA generativa, el procesamiento de datos en tiempo real y las aplicaciones de computación de alto rendimiento (HPC). Para satisfacer las necesidades de los clientes de una gran escala con baja latencia, las instancias P5en se implementan en los UltraClusters de Amazon EC2 y proporcionan capacidades de escalado horizontal líderes del mercado para la capacitación distribuida y las cargas de trabajo de HPC estrechamente acopladas.
Con estas regiones adicionales, las instancias P5en ahora están disponibles en las regiones de AWS este de EE. UU. (norte de Virginia, Ohio), oeste de EE. UU. (Oregón), Europa (España) y Asia-Pacífico (Yakarta, Bombay, Seúl, Tokio y Seúl) y la zona local de EE. UU. (Atlanta) us-east-1-atl-2a en el tamaño p5en.48xlarge.
Para obtener más información, consulte el documento Instancias P5en de Amazon EC2.