Publicado: Nov 8, 2021

O Amazon SageMaker Pipelines, um serviço específico que permite aos clientes definir e orquestrar suas etapas de criação de modelos, agora oferece suporte à retomada da execução de um pipeline com falha/interrupção e às políticas de repetição para etapas do pipeline.

O SageMaker Pipelines fornece uma variedade de etapas (por exemplo, processamento, treinamento, modelo de registro, retorno de chamada etc.). Usando essas etapas, os clientes podem produzir o fluxo de trabalho de construção de modelos de ML como SageMaker Pipelines. Agora, com esses recursos recém-lançados, os clientes podem exercer mais controle operacional e flexibilidade na execução de seus SageMaker Pipelines.

Anteriormente, os clientes tinham que iniciar uma nova execução se o pipeline falhasse ou parasse. Agora, eles podem retomar um pipeline falhou/parado das etapas anteriormente falhadas/interrompidas. Esse recurso torna mais fácil para os clientes depurar seus pipelines e economiza tempo/recursos ao não reexecutar etapas bem-sucedidas anteriormente.

Agora, os clientes também podem configurar políticas de novas tentativas para etapas de pipeline usando os seguintes parâmetros: máximo de tentativas de repetição, intervalo de tempo entre tentativas de repetição, taxa de intervalos de repetição e intervalo de tempo máximo de repetição. Esses parâmetros podem ser configurados na granularidade do pipeline/etapas e podem ser opcionalmente personalizados para tipos de erro específicos. Usando esse recurso, os clientes podem operacionalizar seus pipelines de construção de modelos e incorporar políticas à prova de falhas para erros transitórios/intermitentes.

Esses recursos estão disponíveis em todas as regiões da AWS em que o Amazon SageMaker está disponível. Para começar, crie um novo Pipeline do SageMaker a partir do Amazon SageMaker SDK ou Studio e acesse nossas páginas de documentação sobre políticas de retomada e novas tentativas.