Publicado en: Sep 28, 2023
Las instancias P5 de Amazon EC2, que ofrecen el máximo rendimiento en Amazon EC2 para aplicaciones de aprendizaje profundo y computación de alto rendimiento (HPC), ya están disponibles en la región Este de EE. UU. (Ohio).
Puede usar las instancias P5 para entrenar e implementar modelos de lenguaje de gran tamaño (LLM) y modelos de difusión cada vez más complejos que impulsan las aplicaciones de IA generativa más exigentes. Esto incluye la respuesta a preguntas, la generación de código, la generación de imágenes y videos, el reconocimiento de voz y mucho más. También puede usar las instancias P5 para implementar aplicaciones exigentes de HPC a escala en el descubrimiento de fármacos, el análisis sísmico, la previsión meteorológica y la modelización financiera.
Las instancias P5 funcionan con las últimas GPU NVIDIA H100 con núcleo Tensor y ofrecen el doble de rendimiento de la CPU, el doble de memoria del sistema y el cuádruple de almacenamiento local en comparación con las instancias basadas en GPU de la generación anterior. Ofrecen capacidades de escalabilidad horizontal líderes en el mercado para el entrenamiento distribuido y combinan estrechamente las cargas de trabajo de HPC con hasta 3200 Gbps de redes mediante la tecnología Elastic Fabric Adapter (EFA) de segunda generación. Para satisfacer las necesidades de los clientes a gran escala con baja latencia, las instancias P5 se implementan en Amazon EC2 UltraClusters, lo que proporciona una interconexión sin bloqueo a escala de petabits en hasta 20 000 GPU H100.
Con esta expansión regional, las instancias P5 de Amazon EC2 están ahora disponibles en las regiones este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón).
Para obtener más información sobre las instancias P5, consulte el documento Instancias P5 de Amazon EC2.