发布于: Apr 10, 2018
适用于 Ubuntu 和 Amazon Linux 的 AWS 深度学习 AMI 现包含为 TensorFlow 1.7 定制的高级优化功能,从而为 Amazon EC2 C5 和 P3 实例提供更高的训练性能。
对于基于 CPU 的训练场景,AMI 现在包含使用 Intel 先进矢量指令 (AVX)、SSE 和 FMA 指令集构建的 TensorFlow 1.7,从而加快矢量和浮点计算。AMI 还全面配置了 Intel MKL-DNN,通过 Amazon EC2 C5 实例所用的 Intel Xeon Platinum 处理器,加速中性网络训练所用的数学例程。使用合成 ImageNet 数据集进行 ResNet-50 基准训练,并利用 c5.18xlarge 实例类型上的优化编译,速度比原有 TensorFlow 1.7 二进制训练快 9.8 倍。
此外,为了提高基于 GPU 的场景的训练性能,AMI 包含优化版的 TensorFlow 1.7,全面配置了 NVIDIA CUDA 9 和 cuDNN 7,以发挥 Amazon EC2 P3 实例所用 Volta V100 GPU 的优势,实现混合精确训练。
最后,本次发布还包括 TensorBoard 1.7 以帮助模型训练的可视化和调试。此外 TensorFlow Serving 1.6 可以快速为训练后的模型创建接口终端节点的原型。AMI 还包含 Microsoft Cognitive Toolkit 2.5,但改进了性能并包含漏洞补丁。
如需开始使用 AWS Deep Learning AMI,请参阅开发人员指南。您还可以订阅我们的讨论论坛,获取发布公告以及提出您的问题。