发布于: May 15, 2018
适用于 Ubuntu 和 Amazon Linux 的 AWS Deep Learning AMI 现提供 TensorFlow 1.8 的高级优化版本,可在 Amazon EC2 C5 和 P3 实例上提供更高的训练性能。
对于基于 CPU 的训练场景,AMI 现在包含使用 Intel 先进矢量指令 (AVX)、SSE 和 FMA 指令集构建的 TensorFlow 1.8,从而加快矢量和浮点计算。AMI 还全面配置了 Intel MKL-DNN,可加速 Amazon EC2 C5 实例上神经网络训练所用的数学例程。当我们在批处理大小为 32 的 c5.18xlarge 实例类型上使用优化版时,通过 ImageNet 数据集训练 ResNet-50 基准的速度比在普通 TensorFlow 1.8 二进制文件上训练的速度要快 7 倍。
此外,为了提高基于 GPU 的场景的训练性能,AMI 包含优化版的 TensorFlow 1.8,全面配置了 NVIDIA CUDA 9 和 cuDNN 7,以发挥 Amazon EC2 P3 实例所用 Volta V100 GPU 的优势,实现混合精确训练。
激活虚拟环境时,Deep Learning AMI 会自动部署 TensorFlow 的更高性能版本以及其他深度学习框架,例如针对所选 EC2 实例优化的 Chainer 和 CNTK。
利用我们的快速入门教程和开发人员指南获取更多教程和资源,以便开始使用 AWS Deep Learning AMI。您还可以订阅我们的开发论坛,了解发布公告并提出问题。