Publicado: Nov 29, 2023
Os trabalhos do Caderno do Amazon SageMaker permitem que cientistas de dados executem cadernos sob demanda ou de acordo com um cronograma com alguns cliques no Amazon SageMaker Studio, um IDE baseado na web para machine learning (ML). Hoje, temos o prazer de anunciar que você pode executar programaticamente cadernos como trabalhos usando as APIs fornecidas pelo SageMaker Pipelines, o serviço de orquestração de fluxo de trabalho de ML do SageMaker. Além disso, você pode criar um fluxo de trabalho de ML de várias etapas com vários cadernos dependentes usando essas APIs.
Os cientistas de dados podem usar os trabalhos de Caderno do SageMaker para casos de uso como executar cadernos de longa duração, gerar relatórios recorrentes e aumentar a escala da preparação de pequenos conjuntos de dados de amostra para trabalhos com big data na escala de petabytes. Para mover esses cadernos para produção, os clientes precisam do suporte à API para executar programaticamente cadernos como parte dos fluxos de trabalho de CI/CD. Este lançamento apresenta o trabalho de caderno como um tipo de etapa incorporado durante a criação de pipelines usando o Amazon SageMaker Pipelines. Os clientes podem aproveitar essa etapa de trabalho de caderno para executar facilmente cadernos como trabalhos com apenas algumas linhas de código usando o Amazon SageMaker Python SDK. Além disso, os clientes também podem unir vários cadernos dependentes para criar um fluxo de trabalho na forma de Directed Acyclic Graphs (DAGs – Gráficos acíclicos direcionados). Os clientes podem executar, gerenciar e visualizar esses trabalhos de cadernos ou DAGs usando o Amazon SageMaker Studio.
Esse recurso está disponível ao público em geral em todas as regiões comerciais da AWS que oferecem o Amazon SageMaker Studio. Para saber mais, consulte o Guia do desenvolvedor do SageMaker Studio ou o blog do recurso.