Publicado en: Nov 14, 2023

AWS anuncia la disponibilidad general de la API de topología de instancias de Amazon Elastic Compute Cloud (EC2) para cargas de trabajo de machine learning y computación de alto rendimiento. La API de topología de instancias proporciona a los clientes una vista jerárquica única por cuenta de la proximidad relativa entre las instancias. Los clientes pueden describir la topología de sus instancias para identificar las instancias que están en un grupo estrechamente acoplado y pueden utilizarla para mejorar aún más el tiempo de comunicación y reducir el tiempo de finalización del trabajo.

Los clientes que ejecutan cargas de trabajo paralelas distribuidas, como el entrenamiento de modelos de lenguajes de gran tamaño y la dinámica de fluidos computacional, están escalando sus cargas de trabajo a miles de instancias de EC2. Con la API de topología de instancias de EC2, los clientes pueden describir la topología como un conjunto de nodos de red y filtrar por zona de disponibilidad, nombre de grupo, tipo de instancia e ID de instancia. El conjunto de nodos de red representa la relación descendente de las instancias entre sí dentro de una región. Los clientes pueden incorporar esta topología en el programador que prefieran y utilizarla para asignar instancias a los trabajos de la forma más adecuada.

La API de topología de instancias EC2 ya está disponible en las siguientes regiones de AWS: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio), oeste de EE. UU. (Oregón), Asia Pacífico (Seúl), Asia Pacífico (Tokio), Canadá (Central), Europa (Fráncfort), Europa (Irlanda) y Europa (Estocolmo). Está disponible en las siguientes plataformas de instancias: HPC6id, HPC6a, HPC7a, HPC7g, P3dn, P4d, P4de, P5, TRN1, TRN1n.

Para obtener más información, consulte la última Guía del usuario de EC2 aquí.