Publié le: Nov 26, 2018
Dynamic Training est un projet de Deep Learning open source qui vous permet de réduire le temps et les coûts liés à la formation aux modèles en tirant parti de l'élasticité et l'évolutivité du cloud. La première mise en œuvre de référence de Dynamic Training est basée sur Apache MXNet, et en open source sous Dynamic Training avec Apache MXNet.
La formation distribuée traditionnelle requiert un ensemble d'hôtes fixe, qui participe activement à la tâche de formation tout au long du processus. Avec Dynamic Training, cette exigence a été assouplie : le nombre d'hôtes dans le cluster de formation a la possibilité d'augmenter ou de diminuer tout au long du processus de formation. Cela signifie que les tâches de formation peuvent désormais tirer parti de l'élasticité du calcul du cloud à faible coût. Avec Dynamic Training, vous pouvez ajouter ou supprimer avec élasticité des instances EC2 Spot ou réservées, sans aucune perte de précision, tout en réduisant de manière significative les coûts liés à la formation. Pour commencer, consultez le référentiel GitHub Dynamic Training avec Apache MXNet sur AWS.