張貼日期: Nov 26, 2018

Dynamic Training 是開放原始碼深度學習專案,可以協助您利用雲端的彈性和擴展性,降低模型練習成本並縮短時間。Dynamic Training 的第一個參考實作是建立在 Apache MXNet 的基礎上,並且可在 Dynamic Training with Apache MXNet 下取得開放原始碼。

傳統的分散式訓練需要一組固定的主機,在整個訓練過程中,會積極使用這些主機來進行訓練工作。Dynamic Training 將這項要求鬆綁了:在訓練過程中,您可以增減訓練叢集中的主機數量。也就是說,訓練工作現在可以低成本運用雲端的運算彈性。透過 Dynamic Training,您可以彈性且準確無誤地增加或移除 EC2 Spot 或預留的執行個體,進而大幅降低訓練成本。若要開始使用,請前往 Dynamic Training with Apache MXNet on AWS github 儲存庫。