張貼日期: Jul 23, 2018

適用於 UbuntuAmazon LinuxAWS 深度學習 AMI 現在隨附已針對高效能訓練優化的 TensorFlow 1.9 自訂組建、內含多種效能和可用性增強功能的最新 Apache MXNet 1.2、具有高效能多 GPU 訓練支援的全新 Keras 2-MXNet 後端,以及可改善 MXNet 訓練模型偵錯和視覺化的全新 MXBoard 工具。

使用優化的 TensorFlow 1.9 加快訓練速度

深度學習 AMI 內含直接從原始程式碼客製的 TensorFlow 1.9 運算優化組建,以加快支援 Amazon EC2 C5 執行個體之 Intel Xeon Platinum 處理器的訓練效能。AMI 還提供使用 NVIDIA CUDA 9 和 cuDNN 7 設定的 TensorFlow 1.9 GPU 優化組建,以充分利用支援 Amazon EC2 P3 執行個體之 Volta V100 GPU 上的混合精準訓練。深度學習 AMI 可在您第一次啟用 TensorFlow 虛擬環境時,自動部署已針對您所選 EC2 執行個體優化的 TensorFlow 高效能組建。要進一步了解,請參閱我們的 TensorFlow 教學

此外,對於想要將 TensorFlow 訓練從單一 GPU 擴展到多個 GPU 的開發人員,Horovod 是熱門的開放來源碼分散式訓練架構,可提供完全設定好的 AMI 功能。我們已在這個預先建立的 Horovod 版本推出多種效能增強功能和組態,可讓您在 Amazon EC2 P3 執行個體叢集更快速地執行分散式訓練。如需詳細資訊,請參閱我們的部落格文章

Apache MXNet 1.2 增強功能

深度學習 AMI 支援最新推出的 Apache MXNet 1.2,不但更簡單易用,而且效能更快。MXNet 1.2 內含以 Scala 為基礎的全新執行緒安全高階推論 API,可讓您使用以 MXNet 訓練的深度學習模型更輕鬆地執行預測。MXNet 1.2 還提供全新的 Intel MKL-DNN 整合,可加速運算優化 C5 執行個體上的 convolution、deconvolution 和 pooling 等神經網路運算子,且支援增強的 FP16,以便在支援 Amazon EC2 P3 執行個體之 NVIDIA Volta V100 GPU 的 Tensor Cores 上加速混合精準訓練。最後,MXNet 1.2 隨附新的開放神經網路交換格式 (ONNX) 模組,可將 ONNX 模型匯入 MXNet 符號界面。ONNX 是代表深度學習模型的開放格式,可用來推動深度學習架構間的相互操作性。

使用 Keras 2 MXNet 後端的高效能多 GPU 訓練

深度學習 AMI 已預先安裝新的 Keras-MXNet 深度學習後端。Keras 是高階的 Python 神經網路 API,最為人所知的就是它可輕鬆快速地製作卷積神經網路 (CNN) 和遞歸神經網路 (RNN) 原型。Keras 開發人員現在可使用 MXNet 做為 CNN 和 RNN 分散式訓練的後端深度引擎,並獲得更高的效能。開發人員可使用 Keras 設計、透過 Keras-MXNet 進行訓練,以及在大規模生產環境中使用 MxNet 執行推論。要進一步了解,請參閱這篇部落格文章

改善 MXBoard 的偵錯支援

使用 Python 套裝服務 MXBoard 提供的 API 記錄 MXNet 資料,並在 TensorBoard 中以視覺化的方式呈現,開發人員可以輕鬆偵錯並以視覺的方式查看 MXNet 模型訓練。MXBoard 支援各種視覺化功能,包括直方圖、卷積過濾器、視覺嵌入等。
 

您可以透過我們的逐步指南教學開發人員指南,快速開始使用 AWS 深度學習 AMI。AWS Marketplace 上有最新的 AMI。訂閱我們的開發論壇,以掌握最新消息及發文提問。