发布于: Jul 23, 2018

适用于 UbuntuAmazon LinuxAWS Deep Learning AMI 现随附针对高性能训练而进行优化的自定义版 TensorFlow 1.9、最新版本的 Apache MXNet 1.2(该版本改进了一些性能并提高了可用性)、全新 Keras 2-MXNet 后端(支持高性能多 GPU 训练),以及全新 MXBoard 工具(用于改进 MXNet 训练模型的调试和可视化)。

借助经过优化的 TensorFlow 1.9 加快训练速度

Deep Learning AMI 包括直接从源代码定制的计算优化版 TensorFlow 1.9,可提升为 Amazon EC2 C5 实例提供支持的 Intel Xeon Platinum 处理器的训练性能。AMI 还提供 GPU 优化版 TensorFlow 1.9,该版本配置有 NVIDIA CUDA 9 和 cuDNN 7,以利用为 Amazon EC2 P3 实例提供支持的 Volta V100 GPU 上的混合精度训练。当您第一次激活 TensorFlow 虚拟环境时,Deep Learning AMI 会自动部署针对您选择的 EC2 实例经过优化的高性能版 TensorFlow。要了解更多信息,请参阅我们的 TensorFlow 教程

此外,对于希望将 TensorFlow 训练从单个 GPU 扩展到多个 GPU 的开发人员,AMI 全面配置了 Horovod,这是一个热门开源分布式训练框架。我们在此预构建版 Horovod 中发布了多项性能改进和配置,可加快在 Amazon EC2 P3 实例群集上运行分布式训练的速度。有关详细信息,请参阅我们的博客文章

Apache MXNet 1.2 的改进

Deep Learning AMI 支持最新版本的 Apache MXNet 1.2,可提供更好的易用性和更快的性能。MXNet 1.2 包含一个全新基于 Scala 的线程安全高级推理 API,借此可以使用 MXNet 训练的深度学习模型更轻松地执行预测。MXNet 1.2 还提供全新 Intel MKL-DNN 集成,可加速经过计算优化的 C5 实例上卷积、反卷积和池化等神经网络算子的运算。它也支持增强的 FP16,从而加速为 Amazon EC2 P3 实例提供支持的 NVIDIA Volta V100 GPU 的 Tensor 核心上的混合精度训练。最后,MXNet 1.2 随附全新的开放式神经网络交换格式 (ONNX) 模块,用于将 ONNX 模型导入 MXNet 符号接口。ONNX 是一种表示深度学习模型的开放格式,可用于促进深度学习框架之间的互操作性。

借助适用于 Keras 2 的 MXNet 后端进行高性能多 GPU 训练

Deep Learning AMI 预安装了新的 Keras-MXNet 深度学习后端。Keras 是一种高级 Python 神经网络 API,因其快速简便的卷积神经网络 (CNN) 和循环神经网络 (RNN) 原型设计而广受欢迎。Keras 开发人员现在可以使用 MXNet 作为后端深度引擎,用于 CNN 和 RNN 的分布式训练,同时获得更高的性能。开发人员可以在 Keras 中进行设计,使用 Keras-MXNet 进行训练,并可以在大规模生产环境中使用 MxNet 进行推理。要了解更多信息,请参阅此博客文章

借助 MXBoard 改善了调试支持

MXBoard 是一个 Python 程序包,提供各种 API 来记录 MXNet 数据,以便在 TensorBoard 中实现可视化,开发人员可以借助 MXBoard 来轻松调试和可视化他们的 MXNet 模型训练。MXBoard 支持一系列可视化,包括直方图、卷积滤波器、可视嵌入等。
 

您可以借助我们的分步教程开发人员指南快速开始使用 AWS Deep Learning AMI。最新的 AMI 在 AWS Marketplace 中提供。订阅我们的开发论坛,了解发布的公告并提出问题。