Publicado: Nov 26, 2018

O treinamento dinâmico é um projeto de aprendizado profundo de código aberto que permite que você reduza o tempo e o custo de treinamento de modelo aproveitando a elasticidade e a escala da nuvem. A primeira referência da implementação do treinamento dinâmico é baseada no Apache MXNet e é um código aberto em Treinamento dinâmico com Apache MXNet.

O treinamento distribuído de maneira tradicional necessita um conjunto fixo de hosts que participavam ativamente na tarefa de treinamento durante o processo de treinamento. Com o treinamento dinâmico, esse requisito é flexível: o número de hosts no cluster do treinamento pode aumentar e diminuir durante o processo de treinamento. Isso significa que as tarefas de treinamento podem aproveitar a elasticidade dos recursos da nuvem com pouco custo. Com o treinamento dinâmico, você pode adicionar ou remover o EC2 Spot ou as instâncias reservadas de maneira elástica sem perder precisão, reduzindo significativamente o custo de treinamento. Para começar, acesse o repositório do github Treinamento dinâmico com Apache MXNet na AWS.