Publicado: Nov 29, 2023
Hoje, temos o prazer de anunciar a disponibilidade geral de uma experiência de desenvolvedor simplificada para o Amazon SageMaker Pipelines. O SDK aprimorado do Python permite que você crie rapidamente fluxos de trabalho de machine learning (ML) com a sintaxe familiar do Python. Os principais recursos do SDK incluem um novo decorador Python (@step) para etapas personalizadas, um tipo de etapa de trabalhos de caderno e um agendador de fluxo de trabalho.
Geralmente, o desenvolvimento de ML começa com um código Python monolítico para experimentação no ambiente de desenvolvimento local (por exemplo, cadernos Jupiter) antes da decisão de automatizar a execução por meio de etapas de pipeline desacopladas. Com a nova experiência de desenvolvedor do Amazon SageMaker Pipelines, você pode converter em questão de minutos um código de ML em um Directed Acyclic Graph (DAGs – Gráfico acíclico direcionado) automatizado de várias etapas de ML. Para criar um fluxo de trabalho de ML, anote suas funções existentes do Python com decoradores “@step” e passe a etapa final para a API de criação de pipeline. O Amazon SageMaker interpretará automaticamente as dependências entre as funções anotadas do Python, criará etapas de pipeline personalizadas para cada uma delas e gerará o DAG do pipeline. Se o código de ML estiver espalhado por vários cadernos Python, você poderá encadeá-los para orquestrar um fluxo de trabalho de trabalhos de caderno. Posteriormente, se você quiser executar automaticamente o fluxo de trabalho de forma recorrente, poderá configurar um cronograma de execução usando uma única chamada de função no novo SDK do Python.
Para começar, crie um fluxo de trabalho de ML usando um dos exemplos de cadernos predefinidos no GitHub e visualize-o na interface de usuário do Amazon SageMaker Studio. Acesse o Guia do desenvolvedor do Amazon SageMaker Pipelines para obter mais informações.