Publicado: Nov 2, 2022

Experimentos do Amazon SageMaker Autopilot que usam treinamento com hiperparâmetros geram modelos de ML até duas vezes mais rápido com conjuntos de dados maiores que 100 MB que executam 100 ou mais testes. O Amazon SageMaker Autopilot cria, treina e ajusta automaticamente os melhores modelos de ML com base em seus dados, permitindo que você mantenha controle e visibilidade totais. 

O SageMaker Autopilot oferece dois modos de treinamento: Hyperparameter Optimization (HPO – Otimização de hiperparâmetros) e conjunto. No modo de HPO, o SageMaker Autopilot seleciona os algoritmos mais relevantes para o conjunto de dados e o melhor intervalo de hiperparâmetros para ajustar modelos usando otimização bayesiana. No entanto, para conjuntos de dados maiores (mais de 100 MB), o tempo de ajuste com otimização bayesiana pode ser maior. A partir de hoje, o SageMaker Autopilot usará uma nova estratégia de otimização de hiperparâmetros (HPO) com multifidelidade. A nova estratégia usa um algoritmo de ajuste de hiperbanda de última geração em conjunto de dados maiores que 100 MB com 100 ou mais testes. A estratégia de otimização bayesiana continuará sendo usada em conjuntos de dados com tamanho inferior a 100 MB. Com a estratégia de otimização com multifidelidade, testes com desempenho inferior com base em uma métrica de objetivo selecionada são interrompidos antes, liberando recursos para testes que mostram bom desempenho. Dessa forma, o tempo de ajuste do modo de treinamento HPO em experimentos do SageMaker Autopilot em grandes conjuntos de dados é reduzido. 

Com este lançamento, o tempo de treinamento e ajuste de modelos é reduzido em até duas vezes, permitindo que os clientes ofereçam em menos tempo o modelo de ML de melhor performance. Para avaliar os ganhos de performance, usamos vários conjuntos de dados de referência do OpenML, com tamanhos entre 100 MB e 10 GB. Com base nos resultados, as melhorias no tempo de execução foram de 41% (de uma média de 345 para 203 minutos) em conjuntos de dados moderadamente grandes (100 MB a 1 GB) e 48% (de uma média de 2010 para 1053 minutos) para conjuntos de dados muito grandes (maiores que 1 GB). Com esse aprimoramento, você já pode executar experimentos do SageMaker Autopilot em menos tempo sem precisar alterar as configurações dos trabalhos atuais.

Para obter mais informações, consulte a documentação. Para saber mais sobre o SageMaker Autopilot, acesse a página do produto.