張貼日期: Mar 20, 2019
AWS 深度學習 AMI 現在不僅可以在 Amazon Linux 和 Ubuntu 上使用,也能在 Amazon Linux 下一代的 Amazon Linux 2 上使用了。此外,AWS 深度學習 AMI 現已搭載 MXNet 1.4.0、Chainer 5.3.0、PyTorch 1.0.1 以及 TensorFlow 1.13.1,從頭直接量身打造,經過微調裡,可在 Amazon EC2 執行個體上進行高效能的訓練。
CPU 執行個體上的 TensorFlow 1.13 是從頭直接量身打造,以促進 EC2 C5 執行個體核心的 Intel Xeon Platinum 處理器的效能。使用深度學習 AMI 以合成的 ImageNet 資料對 ResNet-50 模型進行訓練,輸送量的速度會達到庫存 TensorFlow 1.13 二進位檔的 9.4 倍。GPU 執行個體搭載了使用 NVIDIA CUDA 10 和 cuDNN 7.4 設定的 TensorFlow 1.13 優化組建,以充分利用支援 EC2 P3 執行個體之 Volta V100 GPU 上的混合精準訓練。為了希望將 TensorFlow 訓練擴展到多重 GPU 的開發人員,深度學習 AMI 採用了 Horovod 分散式訓練架構。此架構經過全面優化,可有效率地使用由 Amazon EC2 P3 執行個體組成的分散式訓練叢集拓撲。在深度學習 AMI 中使用 TensorFlow 1.13 和 Horovod 訓練 ResNet-50 模型,輸送量的速度會比比 8 個節點上的庫存 TensorFlow 1.13 快 27%。
AWS 深度學習 AMI 現已搭載最新版本的 Apache MXNet 1.4,效能和易用性都有所進步。MXNet 1.4 新增了適用於推論的 Java 繫結、Julia 繫結、實驗性控制流程運算子、JVM 記憶體管理,以及更多幕後的增強功能。此版本的圖形優化和量化也有所改善,加強了對 Intel MKL-DNN 的 MXNet 支援。此功能會減少記憶體使用量並縮短推理時間,而不會大幅降低準確性。
利用開發人員指南中的入門指南和初階到進階教學,快速熟悉 AWS 深度學習 AMI。當您啟用 Conda 環境時,Deep Learning AMI 會自動部署效能較高的架構組建,以針對您選擇的 EC2 執行個體提供優化的效能。如需 AWS 深度學習 AMI 支援的架構和版本的完整清單,請參閱版本備註。您也可以訂閱我們的開發論壇,以取得發佈聲明及發文提問。