Publicado: Dec 3, 2019
O Amazon SageMaker Autopilot já está disponível. Com esse recurso, o Amazon SageMaker pode usar seus dados de tabela e a coluna de destino que você especificar para automaticamente treinar e ajustar seu modelo, com visibilidade completa do processo. Como o nome sugere, você pode usá-lo em piloto automático, implantar o modelo com a mais alta precisão com um clique no Amazon SageMaker Studio ou usá-lo como um guia para tomar decisões, e dessa forma fazer trocas, como precisão por latência ou tamanho de modelo.
Com frequência, é difícil determinar qual algoritmo de ML funcionará melhor com determinado conjunto de dados, sem falar na dificuldade de encontrar parâmetros de algoritmos. Além disso, é preciso limpar os dados ou processá-los previamente para criar bons modelos de ML. Essa é uma tarefa demorada e, por vezes, requer conhecimentos avançados de machine learning. Esses problemas fazem com que as equipes busquem atalhos ou soluções alternativas, como usar um conjunto de dados como está, em vez de limpar e pré-processar os dados. As equipes terminam usando o algoritmo que for mais fácil, e não o algoritmo certo para o problema em questão. Consequentemente, as empresas têm dificuldade de alcançar a qualidade desejada para o modelo. E tem mais, os cientistas de dados com amplo conhecimento de ML gastam muito tempo experimentando diferentes modelos de ML até encontrarem o melhor para determinado problema, principalmente para os aplicativos de publicidade em linha ou IoT, que têm limitações de tamanho de modelo e latência.
O Amazon SageMaker Autopilot simplifica e transforma o processo de machine learning em uma tarefa mais fácil, mais rápida e mais transparente. Agora você pode criar modelos de classificação e regressão sem conhecimentos de deep machine learning. Basta fornecer um conjunto de dados tabulares e selecionar a coluna de destino a prever, que o SageMaker Autopilot automaticamente explora as soluções de machine learning com diferentes combinações de pré-processadores de dados, algoritmos e configurações de parâmetros de algoritmos, para encontrar o modelo mais preciso. Em vez de você ter que decidir qual algoritmo usar, o SageMaker Autopilot automaticamente seleciona o algoritmo certo em uma lista de algoritmos com alta performance e compatíveis e avalia todos eles. O SageMaker Autopilot também experimenta automaticamente diversas configurações de parâmetros nesses algoritmos para obter a melhor qualidade de modelo. Agora você pode implantar diretamente o melhor modelo na produção com apenas um clique ou avaliar vários candidatos a compensar métricas, como precisão, latência e tamanho de modelo. Não é preciso se preocupar com a limpeza e o pré-processamento dos dados, porque o SageMaker Autopilot aplica automaticamente vários tipos de pré-processadores aos dados antes de passá-los pelos algoritmos para treinar modelos.
O Amazon SageMaker Autopilot está disponível nas regiões da AWS Leste dos EUA (Ohio), Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Norte da Califórnia), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Seul), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Canadá (Central), UE (Frankfurt), UE (Irlanda), UE (Londres), UE (Paris) e UE (Estocolmo). Visite a página da documentação para obter mais informações sobre o SageMaker Autopilot e ler a publicação do blog sobre como usar o SageMaker Autopilot para as tarefas de criação de modelo.