Container Insights annonce désormais l'observabilité de l'état des nœuds SageMaker HyperPod sur EKS
Amazon CloudWatch Container Insights découvre désormais automatiquement l'état de vos nœuds SageMaker HyperPod exécutés sur EKS et les présente visuellement dans des tableaux de bord organisés pour vous aider à en surveiller la disponibilité dans un souci d'excellence opérationnelle. Grâce aux tableaux de bord prêts à l'emploi, vous pouvez identifier facilement les nœuds défectueux et les traiter rapidement pour obtenir des durées de formation efficaces.
Container Insights travaille avec SageMaker pour collecter les résultats de la surveillance de l’état approfondie des nœuds HyperPod et les présenter dans des tableaux de bord prédéfinis en vue de vous aider à comprendre l'état et les performances de vos nœuds, mais aussi à déterminer s'ils sont prêts à être planifiés. Container Insights vous aide à optimiser les durées de formation en classant les nœuds défaillants comme « en attente de redémarrage » et « en attente de remplacement », et en vous guidant sur la manière de maintenir l'état des nœuds au cas où le remplacement automatique des nœuds serait désactivé. Si la restauration automatique est activée, vous pouvez avoir une meilleure visibilité sur les mutations de vos nœuds, les retards dans vos tâches de formation et comprendre comment vos tâches reprennent depuis le dernier point de contrôle.
Il est facile de démarrer avec Container Insights. Vous pouvez l'intégrer soit en installant le module complémentaire CloudWatch Observability EKS ou le dernier agent CloudWatch dans vos clusters, soit en mettant à niveau vos Charts de Helm avec la dernière version de CloudWatch Agent. Une fois la configuration terminée, vous pouvez accéder à la console Container Insights et consulter immédiatement l'état de votre nœud SageMaker Hyperpod.
L'observabilité de l'état des nœuds SageMaker HyperPod est désormais disponible dans Container Insights for EKS dans toutes les régions commerciales où SageMaker HyperPod est présent. Les métriques d’état des nœuds d’HyperPod suivent la tarification basée sur l'observation. Consultez la page de tarification de Container Insights pour en savoir plus. Pour en savoir plus, consultez le Guide de l’utilisateur de Container Insights.