Publicado: May 10, 2023
O Amazon SageMaker Autopilot, um serviço de ML (machine learning) de baixo código que cria, treina e ajusta automaticamente os melhores modelos de ML, agora oferece suporte ao treinamento com métricas objetivas ponderadas no modo Ensemble e também oferece suporte a oito métricas objetivas adicionais. Atribuir pesos a cada amostra de dados no conjunto de dados de treinamento pode melhorar o desempenho geral do modelo, ajudando o modelo a aprender melhor, reduzir o viés em relação a uma classe específica e aumentar a estabilidade.
Ao treinar com base em conjuntos de dados não balanceados em que algumas classes têm significativamente menos amostras de dados do que outras, atribuir pesos mais altos a elas pode ajudar o modelo a aprender melhor e reduzir o viés em relação à maioria das classes. A partir de hoje, você pode passar o nome da coluna de peso em seu conjunto de dados de entrada enquanto cria um experimento do Autopilot. O SageMaker Autopilot usará esses valores de peso para saber mais sobre seu conjunto de dados e aplicar o conhecimento adquirido ao treinar o modelo de ML.
O SageMaker Autopilot agora também oferece suporta a oito métricas objetivas adicionais, como RMSE, MAE, R2, Balanced Accuracy, Precision, Precision Macro, Recall e Recall Macro (documentadas aqui). A métrica objetiva selecionada é otimizada durante o treinamento para fornecer a melhor estimativa dos valores dos parâmetros do modelo a partir dos dados. Se você não especificar uma métrica explicitamente, o comportamento padrão é usar automaticamente MSE para regressão, F1 para classificação binária e Precisão para classificação multiclasse.
Para começar, Crie um experimento de SageMaker Autopilot no console do SageMaker Studio. Atualize para a versão mais recente do SageMaker Studio para usar o novo recurso de coluna de pesos de amostra e um conjunto adicional de métricas objetivas. Para saber mais, consulte o guia do desenvolvedor e a página do produto.