Publié le: Nov 8, 2021

Amazon SageMaker Pipelines, un service dédié qui permet aux clients de définir et orchestrer leurs étapes de création de modèle, prend désormais en charge la reprise de l'exécution à la dernière étape infructueuse d'un pipeline ayant échoué/arrêté, ainsi que les politiques de nouvelle tentative pour les étapes de pipeline.

SageMaker Pipelines propose plusieurs étapes tels que le traitement, l'entraînement, l'enregistrement de modèle, le rappel, etc. En suivant ces étapes, les clients peuvent lancer en production le flux de travail de création de modèle ML comme SageMaker Pipelines. Grâce à ces nouvelles fonctions, les clients disposent désormais d'un plus grand contrôle opérationnel et de plus de flexibilité dans l'exécution de leur SageMaker Pipelines.

Auparavant, ils devaient lancer une nouvelle exécution si leur pipeline échouait ou s'arrêtait. Désormais, ils peuvent reprendre un pipeline ayant échoué/arrêté depuis les étapes où il s'est arrêté ou auxquelles l'échec est survenu. Cette fonction permet aux clients de déboguer plus facilement leurs pipelines et leur fait économiser du temps et des ressources, car ils n'ont pas à ré-exécuter les étapes déjà réussis.

Maintenant, les clients peuvent aussi configurer des politiques de nouvelle tentative pour leurs étapes de pipeline à l'aide des paramètres suivants : nombre maximal de tentatives, intervalle de temps entre les tentatives, taux des intervalles de tentative et durée maximale de tentative. Ces paramètres peuvent être configurés au niveau des pipelines/étapes et personnalisés en fonction de types d'erreur spécifiques. Avec cette fonction, les clients ont la possibilité d'opérationnaliser leurs pipelines de création de modèle et d'ajouter des politiques de prévention d'échec pour les erreurs transitoires/intermittentes.

Ces fonctions sont disponibles dans toutes les régions AWS dans lesquelles Amazon SageMaker est proposé. Pour commencer, créez un nouveau pipeline SageMaker à partir du kit SDK ou studio Amazon SageMaker et consultez les pages de la documentation sur la reprise d'exécution et les politiques de nouvelle tentative.