Amazon SageMaker HyperPod introduit un débogage amélioré des scripts de cycle de vie
Amazon SageMaker HyperPod fournit désormais des fonctionnalités de dépannage améliorées pour les scripts de cycle de vie, ce qui facilite l’identification et la résolution des problèmes lors du provisionnement des nœuds de cluster. SageMaker HyperPod vous aide à mettre en place des clusters résilients pour exécuter des charges de travail de machine learning (ML) et développer des modèles de pointe tels que des grands modèles de langage (LLM), des modèles de diffusion et des modèles de fondation (FM).
Lorsque les scripts de cycle de vie rencontrent des problèmes lors de la création d’un cluster ou lors de l’exploitation des nœuds, vous recevez désormais des messages d’erreur détaillés, qui incluent les noms spécifiques des flux de journaux et des groupes de journaux CloudWatch dans lesquels vous pouvez trouver les journaux d’exécution des scripts de cycle de vie. Vous pouvez consulter ces messages d’erreur en exécutant l’API DescribeCluster ou en consultant la page des détails du cluster dans la console SageMaker. La console propose également un bouton « Afficher les journaux des scripts du cycle de vie » qui permet d’accéder directement au flux de journaux CloudWatch concerné, ce qui facilite la localisation des journaux. En outre, les journaux CloudWatch pour les scripts de cycle de vie incluent désormais des marqueurs spécifiques pour vous aider à suivre la progression de l’exécution des scripts du cycle de vie, y compris des indicateurs indiquant quand le journal des scripts du cycle de vie commence, quand les scripts sont téléchargés, quand les téléchargements sont terminés et quand les scripts réussissent ou échouent. Ces marqueurs vous aident à identifier rapidement les problèmes survenus au cours du processus de provisionnement. Ces améliorations réduisent le temps nécessaire pour diagnostiquer et corriger les défaillances des scripts du cycle de vie, ce qui vous permet de rendre vos clusters HyperPod opérationnels plus rapidement.
Cette fonctionnalité est disponible dans toutes les régions AWS dans lesquelles Amazon SageMaker HyperPod est proposé. Pour en savoir plus, consultez la section Gestion des clusters SageMaker HyperPod dans le Guide du développeur Amazon SageMaker.