Veröffentlicht am: Nov 26, 2018
Dynamic Training ist ein Open-Source-Projekt für Deep Learning, mit dem Sie die Kosten und den Zeitaufwand für Modelltrainings reduzieren können, indem Sie die Elastizität und Skalierbarkeit der Cloud nutzen. Die erste Referenzimplementierung von Dynamic Training basiert auf Apache MXNet als Open-Source-Spezifikation unter Dynamic Training mit Apache MXNet.
Ein traditionelles verteiltes Training erfordert einen festen Satz von Hosts, die während des gesamten Trainingsprozesses aktiv am Trainingsjob teilnehmen. Mit Dynamic Training wird diese Anforderung gelockert: Die Anzahl der Hosts im Trainingscluster darf während des Trainingsprozesses steigen und fallen. Damit können Trainingsjobs nun die Berechnungselastizität der Cloud kostengünstig nutzen. Mit Dynamic Training können Sie EC2 Spot oder Reserved Instances ohne an Genauigkeit zu verlieren elastisch hinzufügen oder entfernen, was die Trainingskosten erheblich reduziert. Besuchen Sie zum Einstieg das Github-Repository Dynamic Training mit Apache MXNet auf AWS.