Publicado: Oct 21, 2022
Hoje, temos o prazer de anunciar o suporte ao agendamento de trabalhos de processamento no Amazon SageMaker Data Wrangler. O Amazon SageMaker Data Wrangler reduz de semanas para minutos o tempo de agregação e preparação de dados para machine learning (ML). Com o SageMaker Data Wrangler, é possível simplificar o processo de preparação de dados e engenharia de recursos, além de executar cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados em uma só interface visual. Anteriormente, o agendamento de um trabalho de processamento de dados envolvia a integração com um recurso de computação com tecnologia sem servidor e um serviço de barramento de eventos. Esse processo também exigia a criação de código para agendar o trabalho de processamento de dados em um ambiente de produção. A integração desses diversos recursos em conjunto e a criação do código para orquestrar o fluxo de trabalho podia ser uma tarefa trabalhosa e demorada para cientistas de dados, engenheiros de dados e engenheiros de ML.
Com o suporte ao agendamento no Data Wrangler, você já pode agendar um trabalho de processamento nesse serviço. Os trabalhos podem ser agendados para execução em dias e horários específicos da semana. Os agendamentos também podem ser informados como expressões do CRON, o que permite maior personalização e flexibilidade (por exemplo, agendar um trabalho para execução na primeira quarta-feira de um mês). Você pode anexar até dois agendamentos a um trabalho de processamento do Data Wrangler. Após a especificação do agendamento desejado, o Data Wrangler exibe uma prévia das cinco próximas execuções de trabalhos como confirmação adicional. Esse recurso de agendamento pode ser acessado como parte do fluxo de trabalho “Criar trabalho” do Data Wrangler.
Esse recurso está disponível sem custo adicional em todas as regiões da AWS com suporte do Data Wrangler. Para começar a agendar trabalhos de processamento de dados com o SageMaker Data Wrangler, consulte a documentação da AWS.