Publié le: Nov 29, 2023
Aujourd'hui, nous avons le plaisir d'annoncer la disponibilité générale d'une expérience de développement simplifiée pour Amazon SageMaker Pipelines. Le SDK Python amélioré vous permet de créer rapidement des flux de travail de machine learning (ML) avec une syntaxe Python familière. Les principales fonctionnalités du SDK incluent un nouveau décorateur Python (@step) pour les étapes personnalisées, un type d'étape Notebook Jobs et un planificateur de flux de travail.
Le développement de machine learning commence souvent par un code Python monolithique destiné à être expérimenté dans votre environnement de développement local (ex. les blocs-notes Jupyter) avant que vous ne décidiez d'automatiser son exécution par le biais d'étapes de pipeline découplées. Grâce à la nouvelle expérience de développement Amazon SageMaker Pipelines, vous pouvez convertir votre code ML en un graphe acyclique dirigé (DAG) automatisé de différentes étapes du ML en quelques minutes. Pour créer un flux de travail ML, annotez vos fonctions Python existantes avec des décorateurs « @step » et passez la dernière étape à l'API de création de pipeline. Amazon SageMaker interprétera automatiquement les dépendances entre les fonctions Python annotées, créera des étapes de pipeline personnalisées pour chacune d'entre elles et générera le DAG du pipeline. Si votre code ML est réparti sur plusieurs blocs-notes Python, vous pouvez les enchaîner pour orchestrer un flux de travail composé de Notebook Jobs. Plus tard, si vous souhaitez exécuter automatiquement le flux de travail de manière récurrente, vous pouvez configurer un calendrier d'exécution à l'aide d'un seul appel de fonction dans le nouveau SDK Python.
Pour commencer, créez un flux de travail ML à l'aide de l'un des exemples de blocs-notes prédéfinis sur GitHub et visualisez-le dans l'interface utilisateur Amazon SageMaker Studio. Consultez le guide du développeur Amazon SageMaker Pipelines pour plus d'informations.