投稿日: Apr 10, 2018
Ubuntu および Amazon Linux 用の AWS Deep Learning AMI に、TensorFlow 1.7 に合わせた高度な最適化が提供され、Amazon EC2 C5 および P3 インスタンス全体で高性能なトレーニングを提供できるようになりました。
CPU ベースのトレーニングシナリオの場合、AMI には、ベクトルおよび浮動小数点計算を高速化するためにインテルの Advanced Vector Instructions (AVX)、SSE、FMA 命令セットで構築された TensorFlow 1.7 が含まれています。また、Intel Xeon Platinum プロセッサで動作する Amazon EC2 C5 インスタンスでのニューラルネットワークトレーニングで使用される数学ルーチンを高速化するため、AMI はインテルの MKL-DNN でも完全に設定されています。合成 ImageNet データセットによる ResNet-50 ベンチマークのトレーニングは、c5.18xlarge のインスタンスタイプでの最適化されたビルドを使用する、ストック TensorFlow 1.7 バイナリでのトレーニングよりも 9.8 倍高速でした。
さらに、GPU ベースのシナリオのトレーニングパフォーマンスを向上させるために、AMI に NVIDIA CUDA 9 および cuDNN 7 で完全に構成された TensorFlow 1.7 の最適化ビルドが追加され、Volta V100 GPU で動作する Amazon EC2 P3 インスタンスでの混合精度トレーニングを活用することができます。
最後に、このリリースには、モデルトレーニングの視覚化とデバッグを支援する TensorBoard 1.7 と、訓練されたモデルの推論エンドポイントのプロトタイプを素早く作成する TensorFlow Serving 1.6 も含まれています。また、AMI には、Microsoft Cognitive Toolkit 2.5 も含まれており、パフォーマンスが向上し、バグが修正されています。
開発者ガイドを使用して、AWS Deep Learning AMI を今すぐ始めてください。また、フォーラムをサブスクライブして、開始の通知を受け取ったり、質問を投稿したりすることもできます。