Las instancias P5 de una sola GPU de Amazon EC2 ya están disponibles con carácter general.

Publicado en: 12 de ago de 2025

Hoy, AWS anuncia un nuevo tamaño de instancia P5 de Amazon Elastic Compute Cloud (Amazon EC2) con una GPU NVIDIA H100 que permite que las empresas dimensionen correctamente sus recursos de machine learning (ML) y computación de alto rendimiento (HPC) de forma rentable.

El nuevo tamaño de instancia permite a los clientes comenzar con poco y escalar en incrementos granulares. De esta manera, se ofrece un control más flexible de los costos de infraestructura. Los clientes que desarrollan modelos de lenguaje de gran tamaño (LLM) de pequeños a medianos, como los chatbots o las herramientas de traducción de idiomas especializadas, ahora pueden ejecutar tareas de inferencia de forma más económica. Los clientes también pueden usar estas instancias para implementar aplicaciones de HPC para el descubrimiento farmacéutico, el análisis del flujo de fluidos y los modelos financiero sin tener que comprometerse con costosas implementaciones de GPU a gran escala.

Las instancias P5.4xlarge ya están disponibles mediante bloques de capacidad de Amazon EC2 para ML en las siguientes regiones de AWS: este de EE. UU. (norte de Virginia, Ohio), oeste de EE. UU. (Oregón), Europa (Londres), Asia-Pacífico (Mumbai, Sídney, Tokio) y América del Sur (São Paulo). Estas instancias se pueden comprar bajo demanda, al contado o mediante Savings Plans en las regiones de Europa (Londres), Asia-Pacífico (Mumbai, Yakarta, Tokio) y América del Sur (São Paulo).

Para obtener más información sobre las instancias P5.4xLarge, visite las instancias P5 de Amazon EC2.

Las instancias P5 de una sola GPU de Amazon EC2 ya están disponibles con carácter general.

Aprender

Recursos

Desarrolladores

Ayuda