Publicado: Nov 29, 2023

Hoje, temos o prazer de anunciar a pré-visualização de um novo recurso de triagem inteligente do Amazon SageMaker que inspeciona e avalia automaticamente dados de treinamento em tempo real para usar apenas com as amostras de dados mais informativas no treinamento, reduzindo em até 35% o tempo e o custo de treinamento do modelo. Você pode começar a usar a triagem inteligente de dados em minutos sem alterar pipelines de dados ou scripts de treinamento existentes.

A triagem inteligente usa seu modelo de produção durante o treinamento para analisar as amostras de dados recebidas. Em seguida, ele descarta automaticamente as amostras com baixa perda que não aprimoram o processo de aprendizado do modelo. Ao usar seletivamente somente as amostras de dados mais informativas, a triagem inteligente reduz o tempo e o custo do treinamento de modelos de aprendizado profundo. Os clientes que treinam modelos de aprendizado profundo com o PyTorch em instâncias aceleradas de GPU no SageMaker podem reduzir o tempo de treinamento em até 35%. Como as amostras excluídas apresentam uma perda relativamente baixa, o impacto na precisão do modelo treinado é mínimo ou nulo. Para começar a usar a triagem inteligente, consulte a documentação associada.