Les instances gérées Amazon ECS prennent désormais en charge les métriques GPU NVIDIA
Amazon Elastic Container Service (Amazon ECS) propose désormais des métriques GPU NVIDIA pour les charges de travail conteneurisées exécutées sur des instances gérées Amazon ECS. Ces métriques sont disponibles via Amazon CloudWatch Container Insights avec une observabilité améliorée, offrant aux clients une visibilité sur l’état et les performances des GPU afin de les aider à dépanner et à optimiser les charges de travail accélérées par GPU sur Amazon ECS.
Grâce aux nouvelles mesures GPU, les clients d’Amazon ECS Managed Instances peuvent désormais surveiller la capacité, l’utilisation, la mémoire, l’état du matériel et les conditions thermiques du GPU directement dans CloudWatch. Grâce à Container Insights avec une observabilité améliorée, les clients bénéficient d’une visibilité granulaire sur ces métriques, y compris au niveau du périphérique GPU. Ces métriques donnent aux clients une visibilité sur le fonctionnement et l’état du matériel des GPU de leur parc d’instances gérées Amazon ECS, ce qui leur permet de dimensionner correctement la capacité du GPU, de résoudre les problèmes de performances et de détecter les problèmes avant qu’ils n’aient un impact sur les charges de travail accélérées par le GPU, comme la formation et l’inférence en matière d’IA et de machine learning.
Les métriques GPU NVIDIA pour les instances gérées Amazon ECS sont disponibles via Container Insights dans toutes les Régions AWS commerciales. Pour commencer, activez Container Insights avec une observabilité améliorée sur votre cluster Amazon ECS et lancez des types d’instances Amazon EC2 accélérés par GPU via un fournisseur de capacité Amazon ECS Managed Instances. Pour connaître la tarification de Container Insights, consultez la page Tarification d’Amazon CloudWatch. Pour en savoir plus, consultez le Guide de l’utilisateur d’Amazon ECS Container Insights avec mes métriques d’observabilité améliorées.