投稿日: May 15, 2018
Ubuntu および Amazon Linux 用の AWS Deep Learning AMI に、TensorFlow 1.8 の高度な最適化が提供され、Amazon EC2 C5 および P3 インスタンス全体で高性能なトレーニングを提供できるようになりました。
CPU ベースのトレーニングシナリオの場合、AMI には、ベクトルおよび浮動小数点計算を高速化するためにインテルの Advanced Vector Instructions (AVX)、SSE、FMA 命令セットで構築された TensorFlow 1.8 が含まれています。また、Amazon EC2 C5 インスタンスでのニューラルネットワークトレーニングで使用される数学ルーチンを高速化するため、AMI はインテルの MKL-DNN でも完全に設定されています。バッチサイズが 32 である c5.18xlarge インスタンスタイプで最適化されたビルドを使用すると、ImageNet データセットによる ResNet-50 ベンチマークのトレーニングは、ストック TensorFlow 1.8 バイナリでのトレーニングの 7 倍高速でした。
さらに、GPU ベースのシナリオのトレーニングパフォーマンスを向上させるために、AMI に NVIDIA CUDA 9 および cuDNN 7 で完全に構成された TensorFlow 1.8 の最適化ビルドが追加され、Volta V100 GPU で動作する Amazon EC2 P3 インスタンスでの混合精度トレーニングを活用することができます。
仮想環境を有効にすると、Deep Learning AMI は自動的に TensorFlow の高性能なビルド、ならびに選択した EC2 インスタンスに合わせて最適化された Chainer および CNTK などのその他のディープラーニングのフレームワークをデプロイします。
開始方法チュートリアルや開発者ガイドなどのチュートリアルやリソースを活用して、AWS Deep Learning AMI を使い始めてください。また、フォーラムをサブスクライブして、開始の通知を受け取ったり、質問を投稿したりすることもできます。