Amazon CloudWatch Container Insights prend désormais en charge les serveurs Neuron UltraServers sur Amazon EKS
Amazon CloudWatch Container Insights prend désormais en charge les serveurs Neuron UltraServer sur Amazon EKS, offrant ainsi une meilleure observabilité aux clients qui exécutent des charges de travail de machine learning hautes performances et à grande échelle sur des nœuds multi-instances. Cette nouvelle fonctionnalité permet aux scientifiques des données et aux ingénieurs ML de surveiller et de dépanner efficacement leurs applications ML conteneurisées, en proposant des mesures agrégées et une gestion simplifiée des groupes Neuron UltraServer.
Les Neuron UltraServers combinent plusieurs instances EC2 en une seule unité de serveur logique, optimisée pour les charges de travail de machine learning à l'aide des accélérateurs AWS Trainium et Inferentia. Container Insights, une fonctionnalité de surveillance et de diagnostic d'Amazon CloudWatch, collecte automatiquement les métriques des applications conteneurisées. Avec ce lancement, Container Insights introduit un nouveau filtre spécialement conçu pour les serveurs UltraServers dans les environnements EKS. Vous pouvez désormais sélectionner un ID UltraServer pour afficher de nouvelles métriques agrégées pour toutes les instances de ce serveur, sans avoir à surveiller les instances séparément. Outre les métriques par instance, vous pouvez désormais consulter des données de performances consolidées pour l'ensemble du groupe UltraServer, rationalisant ainsi la surveillance des charges de travail de machine learning exécutées sur AWS Neuron.
L'agent Amazon CloudWatch Container Insights est disponible dans toutes les régions commerciales AWS et AWS GovCloud (US).
Pour commencer, consultez la section Métriques AWS Neuron pour AWS Trainium et AWS Inferentia du Guide de l'utilisateur d'Amazon CloudWatch