O Amazon SageMaker Autopilot adiciona validação cruzada automática para melhorar a qualidade do modelo em conjuntos de dados menores em até 35%

Publicado: May 28, 2021

O Amazon SageMaker Autopilot cria, treina e ajusta automaticamente os melhores modelos de machine learning para classificação ou regressão com base em seus dados, permitindo a você manter controle e visibilidade totais. A partir de hoje, o Autopilot realiza validação cruzada em conjuntos de dados de entrada com menos de 50.000 linhas para todos os tipos de problemas: regressão, classificação binária e classificação multiclasse. Com a validação cruzada, você se beneficia de maior robustez para divisões indesejadas entre dados de treinamento e validação, resultando em melhor qualidade do modelo. Dependendo do conjunto de dados e do tipo de problema, você pode notar uma melhoria na qualidade do modelo em até 35%.

Autopilot divide automaticamente seus conjuntos de treinamento e validação de introdução de dados de entrada. Com esta versão, o Autopilot também usa o método de validação cruzada k-fold e executa inferência com o conjunto de modelos de validação cruzada do ensaio com a melhor métrica de validação. O Autopilot garante que cada dobra de treinamento e validação tenha representação igual de cada classe para ajudar a melhorar a precisão e construir o melhor modelo com os dados disponíveis. Você pode visualizar a métrica de validação final para cada modelo na saída de seu experimento Autopilot antes de escolher implantar o modelo. Além disso, as atualizações detalhadas de validação cruzada, incluindo as métricas de treinamento e validação de cada dobra, estão disponíveis no Amazon CloudWatch.

A validação cruzada automática agora está disponível em todas as regiões da AWS onde o SageMaker Autopilot é compatível atualmente. Para começar a usar, revise nossa documentação ou acesse o Amazon SageMaker Studio para criar um novo experimento do Autopilot.

O Amazon SageMaker Autopilot adiciona validação cruzada automática para melhorar a qualidade do modelo em conjuntos de dados menores em até 35%

Encerramento do suporte para o Internet Explorer