Publié le: Nov 14, 2023

AWS annonce la disponibilité générale de l'API Amazon Elastic Cloud Compute (EC2) Instance Topology pour les charges de travail de machine learning et de calcul haute performance. Elle fournit à nos clients une vue hiérarchique unique par compte de la proximité relative entre leurs instances. Il est possible de décrire la topologie de ces instances pour identifier celles qui font partie d'un groupe étroitement lié. La communication s'en trouve accélérée, et le temps d'exécution des tâches réduit.

Les clients qui exécutent des charges de travail parallèles distribuées (par exemple l'entraînement de grands modèles de langage et la mécanique des fluides numériques) mettent à l'échelle leurs charges de travail en intégrant des milliers d'instances EC2. Grâce à l'API EC2 Instance Topology, ils peuvent décrire la topologie comme un ensemble de nœuds de réseau qu'ils filtrent par zone de disponibilité, nom de groupe, type d'instance et ID d'instance. L'ensemble de nœuds de réseau représente la relation descendante des instances les unes par rapport aux autres au sein d'une région. Nos clients peuvent intégrer cette topologie dans le planificateur de leur choix et l'utiliser pour attribuer aux tâches les instances les plus adaptées.

L'API EC2 Instance Topology est désormais disponible dans les régions AWS suivantes : Asie-Pacifique (Séoul), Asie-Pacifique (Tokyo), Canada (Centre), Europe (Francfort), Europe (Irlande), Europe (Stockholm), USA Est (Ohio), USA Est (Virginie du Nord) et USA Ouest (Oregon). Elle est proposée sur les plates-formes d'instance suivantes : HPC6id, HPC6a, HPC7a, HPC7g, P3dn, P4d, P4de, P5, TRN1 et TRN1n.

Pour en savoir plus, consultez la dernière version du guide de l'utilisateur d'EC2.