Publicado en: Jul 26, 2023

Hoy, AWS anuncia la disponibilidad general de las instancias P5 de Amazon Elastic Compute Cloud (Amazon EC2), que funcionan con las últimas GPU NVIDIA H100 con núcleo Tensor. Estas instancias ofrecen el mayor rendimiento de Amazon EC2 para aplicaciones de aprendizaje profundo e informática de alto rendimiento (HPC). Le ayudan a acelerar el tiempo de creación de soluciones hasta seis veces y a reducir los costos de formación de ML automático hasta un 40% en comparación con las instancias basadas en GPU de la generación anterior.

Puede usar las instancias P5 de Amazon EC2 para entrenar e implementar modelos de lenguaje de gran tamaño (LLM) y modelos de difusión cada vez más complejos que impulsan las aplicaciones de IA generativa más exigentes. Esto incluye la respuesta a preguntas, la generación de códigos, la generación de imágenes y videos, el reconocimiento de voz y mucho más. También puede usar las instancias P5 para implementar aplicaciones exigentes de HPC a escala en el descubrimiento farmacéutico, el análisis sísmico, la previsión meteorológica y la modelización financiera.

Para ofrecer estas mejoras de rendimiento y ahorrar costos, las instancias P5 combinan las GPU NVIDIA H100 con núcleo Tensor con el doble de rendimiento de la CPU, el doble de memoria del sistema y el cuádruple de almacenamiento local en comparación con las instancias basadas en GPU de la generación anterior. Ofrecen capacidades de escalabilidad horizontal líderes en el mercado para la formación distribuida y combinan estrechamente las cargas de trabajo de HPC con hasta 3200 Gbps de redes mediante la tecnología Elastic Fabric Adapter (EFA) de segunda generación. Para satisfacer las necesidades de los clientes de gran escala con baja latencia, las instancias P5 se implementan en Amazon EC2 UltraClusters. Estos proporcionan una interconexión no bloqueante a escala de petabits en hasta 20 000 GPU H100, lo que proporciona hasta 20 exaflops de capacidad informática agregada.

Las instancias P5 ya están disponibles en las regiones de AWS este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón) en los tamaños p5.48xl.

Para obtener más información sobre las instancias P5, consulte el documento Instancias P5 de Amazon EC2.