发布于: Mar 20, 2019
除了 Amazon Linux 和 Ubuntu,AWS Deep Learning AMI 现在还适用于下一代 Amazon Linux - Amazon Linux 2。此外,AWS Deep Learning AMI 现在还随附 MXNet 1.4.0、Chainer 5.3.0、PyTorch 1.0.1 和 TensorFlow 1.13.1,这些工具直接从源中自定义构建,专门面向 Amazon EC2 实例中的高性能训练。
在 CPU 实例中,TensorFlow 1.13 直接从源中自定义构建,从而加速了支持 EC2 C5 实例的 Intel Xeon Platinum 处理器的性能。它通过采用 Deep Learning AMI 的合成 ImageNet 数据来训练 ResNet-50 模型,其吞吐量比现有 TensorFlow 1.13 二进制加快 9.4 倍。GPU 实例随附优化版 TensorFlow 1.13,该版本配置有 NVIDIA CUDA 10 和 cuDNN 7.4,以利用为 EC2 P3 实例提供支持的 Volta V100 GPU 上的混合精度训练。对于希望将 TensorFlow 训练扩展到多 GPU 的开发人员,Deep Learning AMI 还配备了 Horovod 分布式训练框架。该框架经过全面优化,可有效利用由 Amazon EC2 P3 实例组成的分布式训练集群拓扑。它使用 Deep Learning AMI 中的 TensorFlow 1.13 和 Horovod 来训练ResNet-50 模型,其吞吐量比现有 8 节点上的 TensorFlow 1.13 加快了 27%。
AWS Deep Learning AMI 现在随附最新 Apache MXNet 1.4 版本,可提供更高性能且简单易用。MXNet 1.4 添加了 Java 推理绑定、Julia 绑定、实验性控制流运算符、JVM 内存管理和许多其他底层增强功能。该版本还改进了 Intel MKL-DNN 的 MXNet 支持,同时还改进了图形优化和量化性能。该功能减少了内存使用量并缩短了推理时间,同时不会对准确性产生很大影响。
要快速开始使用 AWS Deep Learning AMI,请参阅开发人员指南中的入门指南和初级到高级教程。在您激活 Conda 环境时,Deep Learning AMI 会自动部署为您选择的 EC2 实例优化的更高性能版本的框架。如需 AWS Deep Learning AMI 支持的框架和版本的完整列表,请查看发行说明。您还可以订阅我们的开发论坛,以获取发布公告并提出您的问题。