Amazon Web Services ブログ
トヨタ・リサーチ・インスティテュート、AWS の深層学習により安全性が高い自動運転車を世界規模で急速展開
社会は自動運転技術を搭載した車両から数多くの恩恵を受けます。トヨタ・リサーチ・インスティテュート (TRI) が最優先事項の一つに掲げているのが、進化した最新の人工知能 (AI) を活用してより安全で、利用しやすく、環境にも優しい車両を生産することです。TRI はその目標達成に役立てるためアマゾン ウェブ サービス (AWS) の深層学習に着目しました。
TRI は、Amazon EC2 P3 インスタンスを利用することで、以前使用していた P2 インスタンスと比較して訓練時間が 4 倍も速くなり、訓練時間が数日から数時間に短縮されました。これにより、モデル車を素早く最適化した上で短期間でトレーニングを再度行い、テストカーやシミュレーション環境に展開してさらにテストすることができます。また、AWS の「pay-as-you-go」モデルと組み合わせて、P2 インスタンスに対して P3 インスタンスのパフォーマンスを大幅に向上させたことで、TRI の運用コストを削減しました。
自動運転のための深層学習モデルの作成
TRI は、その自動運転技術のため単一技術のスタックを開発し、2 つのモードを用意しました。保護者 (Guardian) モードと運転手 (Chauffeur) モードです。保護者モードでは、ドライバーは常に車輪と路面状態に気を配る必要がありますが、運転中の社内外の環境を絶えず監視することで衝突危機を認識した時に必要なタイミングで介入を行います。運転手モードも同じ技術を使用しますが、車両は常に制御されており、厳密に乗客を乗せられる乗用車です。
自律型車両を開発および展開するには、膨大な量のデータ、高性能コンピューティング能力、高度な深層学習技術を結集、格納、管理する能力と、車両内でリアルタイムに処理する能力が求められます。
TRI は PyTorch の深層学習フレームワークを利用することで深層学習コンピュータビジョンモデルを作成し、両運転モードで自動的に監視および制御を行えるようにしました。TRI には、深層学習モデルで使用するデータを収集するため、カメラ、レーダー、LIDAR (3D 空間でオブジェクト表現を生成するための制御およびナビゲーションに使用される技術) などのさまざまなタイプのデータ収集センサーが装備されたテストカーを数多く保有しています。テストカーは、様々な運航設計領域 (Operational Design Domains、ODD) を駆け抜け、車両 1 台につき 1 日合計テラバイト単位のデータを収集して記録します。このデータは、分析、機械学習の再学習モデルやシミュレーションのため、素早く検索、準備および利用可能な状態にする必要があります。
TRI は、正確なトレーニングモデルには、数兆マイルの試験走行が必要だと考えています。1 億台以上のトヨタ車が路上を走行している今日、ドライバーは様々な運転状況を経験します。車両のテストを補完するため、TRI はシミュレーションを用いてさまざまな希少条件やシナリオをモデル化します。シミュレーションでは、暴風雨、吹雪、日中・夜間の異なる時間帯のギラツキや、さまざまな路面状態や周囲の状況といった厳しい状況で、機会学習モデルがどのように反応するかをテストするフォトリアルデータストリームを生成します。
TRI は、新しいテストデータが利用できるようになると、研究アイデアを間髪入れずに模索し、モデルを素早くトレーニングして、更新版をテストカーに搭載し、テストを再実行できるようにします。
「Amazon EC2 P3 インスタンスを用いることで、モデルのトレーニング時間を 75 % 短縮しました。これにより、研究開発の速度を速めつつ、新しいデータを迅速に組み込み、モデルに再学習させ、アイデアを探求し、モデルの精度を高め、さらに新しい機能を素早く導入できます。」と、トヨタ・リサーチ・インスティテュートの機械学習リーダーである Adrien Gaidon 博士は述べています。
次の図は、TRI のテストカーによるデータ収集の流れを示しています。車両がテスト走行から戻ってくると、車両からソリッドステートドライブ (SSD) を抜き取り、ローカルネットワーク接続ストレージ (NAS) にデータをアップロードするインジェストマシンに投入します。次にデータをすぐに Amazon S3 データレイクにアップロードし、他のサイトは Amazon S3 イベントによってデータが取り込まれた Amazon SQS キューを受け取る一方、異なるサイト間でデータを同期します。
興味深いデータポイントを含むこのアップロードされたデータのスニペットは、TRI の深層学習モデルを再学習するのに使用します。このデータはシミュレーション環境でも活かされ、すべてのテストシナリオを更新します。
クラウドベースのディープラーニング
TRI には、大量のデータを処理できる IT プラットフォームが必要でした。それは機械学習モデルを素早くトレーニングするために必要な処理能力があり、要件を満たすために拡張できるものです。AWS を使用することで、コンピューティングおよびストレージリソースをオンデマンドでスピンアップし、より高度な管理およびオーケストレーションサービスと組み合わせることができるようになりました。これにより、TRI の開発チームは研究開発サイクルの回転を速め、膨大な量のデータをテストすることができます。
TRI は Amazon S3 を用いてどこからでも任意の量のデータを保存および取得し、また Amazon SQS を利用してリモートデータ収集サイトとの間でデータの転送を調整します。機械学習モデルのトレーニングを加速させるために TRI が必要とするコアコンピューティング機能は、NVIDIA の最新 Tesla V100 GPU を搭載した複数の Amazon EC2 P3 インスタンスによって強化しています。P3 インスタンスは、クラウドで利用できる最速の GPU インスタンスの一端です。P3 インスタンスはモデルのトレーニング時間をわずか数時間または数分まで短縮し、データサイエンティストや機械学習エンジニアがより迅速に反復し、より多くのモデルをトレーニングし、さらにアプリケーションに競争力を持たせる上で役立ちます。
「AWS クラウド、特に Amazon EC2 P3 インスタンスを利用することで、膨大な量のデータを効率的に実行および処理するスケーラブルで高性能のアプリケーションスタックを構築できます」と、トヨタ・リサーチ・インスティテュートのインフラエンジニアリング部門のテクニカルリード、Mike Garrison 氏は述べています。
TRI は Amazon EC2 P3 インスタンス、Amazon S3、Amazon SQS、AWS ネットワーキングサービスのディープラーニングを使用することで、スケーラブルなソリューションを構築して、開発チームの開発を後押し、AI を活用してトヨタが安全で交通事故や死亡事故のない未来を実現することに一歩近づく上で役立てるという壮大なビジョンを実現可能にします。
詳しくは、AWS での機械学習と Amazon EC2 P3 インスタンスが貴社の AI の取り組みを後押しするのにどう役立つかをご覧ください。
今回のブログ投稿者について
Geoff Murase は、AWS EC2 アクセラレーションコンピューティングインスタンスのシニアプロダクトマーケティングマネージャーで、グラフィックスプロセッシングユニット (GPU) やフィールドプログラマブルゲートアレイ (FPGA) などのハードウェアベースのコンピュートアクセラレータへのアクセスを提供することにより、顧客がコンピューティングニーズを満たすのをサポートしています。余暇はバスケットボールや家族とのツーリングを楽しんでいます。