投稿日: Apr 26, 2018
AWS 深層学習 AMI に、Chainer 4 と Microsoft Cognitive Toolkit (CNTK) 2.5.1 向けの先進的な最適化機能が盛り込まれます。Amazon EC2 インスタンス上でよりパフォーマンスに優れたトレーニングを提供するための機能強化が図れます。
GPU ベースのトレーニングの場合、Amazon EC2 P3 インスタンスをパワーアップする NVIDIA Volta V100 GPU 上で混在精度のトレーニングを活用するために、CuPy、NVIDIA CUDA 9、cuDNN 7 用の詳細な設定が施された Chainer 4 が AMI に付属します。また、Chainer 4 では精度の低いコンピューティングで使用される Volta GPU の TensorCores 向けのサポートも改善されます。AMI はまた、Amazon EC2 P3 インスタンス上でトレーニングを加速するために、NVIDIA CUDA 9 と cuDNN7 に対応した CNTK 2.5.1 GPU ビルドをデプロイします。
CPU ベースのトレーニングでは、AMI に Amazon EC2 のコンピューティングで最適化された C5 や C4 のインスタンスをパワーアップする、Intel アーキテクチャ上のコンボルージョンなど、深層学習操作を加速する Intel’s Deep Learning Extension Package (iDeep) 用に設定された Chainer 4 が付属します。また、AMI は今後、ニューラルネットワークルーチンを最適化するために、Intel Math Kernel Library for Deep Neural Networks (Intel MKL-DNN) 向けにフル設定された CNTK 2.5.1 CPU 専用ビルドをデプロイします。
深層学習 AMI はユーザーが初めてフレームワークの仮想環境をアクティブ化したときに、ユーザーの選んだ EC2 インスタンス用に最適化された深層学習フレームワークの高パフォーマンスビルドを自動的にデプロイします。これは、AMI が Amazon EC2 インスタンスファミリー向けに、TensorFlow の最適化されたビルドをデプロイする方法とも似ています。
開発者ガイドを使用して、AWS Deep Learning AMI を今すぐ始めてください。また、フォーラムにサブスクライブして、開始の通知を受け取ったり、質問を投稿したりすることもできます。