Amazon SageMaker HyperPod annonce une nouvelle fonctionnalité d'observabilité
La nouvelle fonctionnalité d'observabilité d'Amazon SageMaker HyperPod permet aux clients d'accélérer le développement de modèles d'IA générative en fournissant une visibilité complète sur les ressources de calcul et les tâches de développement de modèles. Il supprime le travail manuel qui consiste à collecter des centaines de métriques provenant de l'ensemble de la pile, à visualiser les corrélations entre elles et à rétablir les performances des tâches de développement de modèles d'IA générative. L'observabilité d'HyperPod suit les métriques de performance des tâches en temps réel, alerte les clients en cas de détérioration de l'une d'entre elles et remédie automatiquement à la cause première grâce à des stratégies définies par le client.
L'observabilité de SageMaker HyperPod transforme la façon dont les clients surveillent et optimisent leurs tâches de développement de modèles d'IA générative. Grâce à un tableau de bord unifié préconfiguré dans Amazon Managed Grafana avec les données de surveillance publiées automatiquement dans un espace de travail Amazon Managed Prometheus, les clients peuvent désormais consulter en même temps les métriques de performance des tâches d'IA générative, l'utilisation des ressources et l'état du cluster. Cela permet aux équipes de détecter rapidement les goulots d'étranglement, d'éviter des retards coûteux et d'optimiser les ressources de calcul. Les clients peuvent définir des alertes automatisées, obtenir des métriques de tâches spécifiques à chaque cas d'utilisation et les publier sur le tableau de bord unifié en quelques clics. En réduisant le temps de dépannage de plusieurs jours à quelques minutes, cette fonctionnalité aide les clients à accélérer leur transition vers la production et à optimiser leur retour sur investissement en IA.
L'observabilité de SageMaker HyperPod est disponible dans toutes les régions AWS où SageMaker HyperPod est pris en charge, à l'exception des régions USA Ouest (Californie du Nord) et Asie-Pacifique (Melbourne). Pour en savoir plus et commencer, consultez le blog, la documentation et la page Web de SageMaker HyperPod.