Amazon Web Services ブログ

AWS Deep Learning AMI に、最適化された TensorFlow 1.7 が追加され、Amazon EC2 C5 および P3 インスタンスでの高速なトレーニングが可能に

Ubuntu および Amazon Linux 用の AWS Deep Learning AMI に、TensorFlow 1.7 に合わせた高度な最適化が提供され、Amazon EC2 インスタンスファミリ全体で高性能なトレーニングを提供できるようになりました。これは 3 月下旬に開始した TensorFlow 1.6 の最適化されたビルドの更新です。

最適化された TensorFlow 1.7 で、トレーニングをより高速に

Amazon Machine Images (AMI) に、インテルの高度ベクトル命令 (AVX)、SSE、FMA 命令セットを備えた TensorFlow 1.7 ビルドが追加されました。AMI は、インテルの深層ニューラルネットワーク用数学カーネルライブラリ (Intel MKL-DNN) で完全に構成されており、インテル Xeon Platinum プロセッサ搭載の Amazon EC2 C5 インスタンスで高性能なトレーニングを提供できるようになりました。合成 ImageNet データセットによる ResNet-50 ベンチマークのトレーニングは、c5.18xlarge のインスタンスタイプでの最適化されたビルドを使用する、ストック TensorFlow 1.7 バイナリでのトレーニングよりも 9.8 倍高速でした。

また、AMI に NVIDIA CUDA 9 および cuDNN 7 で完全に構成された TensorFlow 1.7 の最適化ビルドも追加され、Volta V100 GPU 搭載の Amazon EC2 P3 インスタンスでの混合精度トレーニングを活用することができます。ディープラーニング AMI は、初めて TensorFlow 仮想環境を有効にするときに、選択した EC2 インスタンスに合わせて最適化された TensorFlow の高性能ビルドを自動的にデプロイします。

AMI には、モデルトレーニングの視覚化とデバッグを支援する TensorBoard 1.7 と、訓練されたモデルの推論エンドポイントのプロトタイプを素早く作成する TensorFlow Serving 1.6 も含まれています。

最新のディープラーニングのフレームワーク

Deep Learning AMI に、Microsoft Cognitive ツールキット 2.5 が追加され、パフォーマンスが向上し、バグが修正されています。また、AMI には、最新のディープラーニングのフレームワークも付属しています。

CUDA 9 によるフレームワーク:

  • Apache MXNet 1.1 (Gluon 付き)
  • Caffe2 0.8.1
  • Microsoft Cognitive ツールキット (CNTK) 2.5
  • PyTorch 0.3.1
  • TensorFlow 1.7
  • Theano 1.0
  • Chainer 3.5
  • CUDA 8 による Caffe 1.0
  • Keras 1.2.2 と Keras 2.1.5

AMI は、次のツールにより提供されるモデルのサービスとデバッグ機能も含みます。

  • Apache MXNet Model Server 0.1
  • TensorFlow Serving 1.6
  • TensorBoard 1.7

Deep Learning AMI の使用開始

AWS Deep Learning AMI を使い始めるのはすぐにできて簡単です。最新の AMI が、AWS Marketplace で利用可能になりました。また、フォーラムをサブスクライブして、新しい開始の通知を受け取ったり、質問を投稿したりすることもできます。


今回のブログの投稿者について

Sumit Thakur は AWS 深層学習のシニアプロダクトマネージャーです。特に深層学習 AMI のエンジンを使いやすくすることに焦点を当て、ユーザーがクラウドでディープラーニングを開始しやすくする製品を担当しています。自然に触れたり、SF の TV シリーズ鑑賞が趣味です。