Publicado en: Feb 1, 2024
Hoy, Amazon Web Services anuncia que los bloques de capacidad para ML de Amazon Elastic Compute Cloud (Amazon EC2) ahora admiten instancias P5 en la región Este de EE. UU. (Virginia del Norte) e instancias P4d en las regiones Este (Ohio) y Oeste de EE. UU. (Oregón). Puede utilizar los bloques de capacidad de EC2 para reservar instancias muy solicitadas de GPU en un UltraCluster de Amazon EC2 para una fecha futura durante el tiempo que necesite para ejecutar sus cargas de trabajo de machine learning (ML).
Los bloques de capacidad de EC2 le permiten reservar la capacidad de la GPU con hasta ocho semanas de antelación para períodos de uno a 14 días en clústeres de una a 64 instancias (512 GPU), lo que le brinda la flexibilidad de ejecutar una amplia gama de cargas de trabajo de ML. Son ideales para cargas de trabajo de preentrenamiento y ajuste de corta duración, para la creación rápida de prototipos y para gestionar los aumentos repentinos de la demanda de inferencias. Los bloques de capacidad de EC2 ofrecen conectividad de baja latencia y alto rendimiento mediante la colocación en Amazon EC2 UltraClusters.
Con esta expansión, los bloques de capacidad de EC2 para ML están disponibles para los siguientes tipos de instancias y regiones de AWS: instancias P5 en el este de EE. UU. (Norte de Virginia y Ohio), instancias P4d en el este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón).
Para comenzar, visite la consola de administración de AWS, la interfaz de línea de comandos (CLI) de AWS y los SDK de AWS. Para obtener más información, consulte la Guía del usuario de bloques de capacidad de Amazon EC2 para ML.