高度運転支援システムの機械学習モデル開発を
Amazon SageMaker をはじめとするマネージドサービスで自動化
データ管理工数を 55%、ML エンジニアの作業工数を 66% に削減
2021
世界有数の自動車部品サプライヤーとして、先進的な自動車技術、システム・製品を提供する株式会社デンソー。自動運転 / 高度運転技術の開発を手がける AD&ADAS 技術 1 部は、画像認識の機械学習モデル開発において、生産性向上とトレーサビリティ確保に向けてアマゾン ウェブ サービス(AWS)の Amazon SageMaker をはじめとするマネージドサービスを導入。データエンジニアのデータ管理工数を従来比の 55% まで、機械学習(ML)エンジニアの繰り返し学習の作業工数を 66% まで削減しました。
Amazon SageMaker の採用で、データ取得、モデル開発、学習、評価のサイクルを高速に回し、高度運転支援システムにおける画像認識の機械学習モデルの完成度を高めることができました。また、マネージドサービスによってエンジニアのリソースを、付加価値を高める業務に集中できるようになったことも大きな成果です
横井 健介 氏
株式会社デンソー
AD&ADAS 技術 1 部 第 6 技術室長
画像認識要件の多様化により機械学習の生産性向上が課題に
「世界と未来をみつめ、新しい価値の創造を通じて人々の幸福に貢献する」を理念に、世界を舞台にビジネスを展開するデンソー。現在、長期方針「VISION2030」のもと、「電動化」、「先進安全・自動運転」、「コネクティッド」、「FA ・農業」の 4 つを重点分野に位置付けています。先進安全・自動運転の分野で、高度運転支援システム(ADAS)向けの画像センサーの開発を担う AD & ADAS 技術 1 部では、ADAS の画像認識においてオンプレミス環境に GPU クラスタを構築して ML モデルを開発してきました。大量のデータから複数のモデル開発が求められる中、一定期間内で複数の ML エンジニア同士が GPU リソースを調整しあいながら利用していたため、今後画像センサーの進化、性能向上ニーズにより検出対象の増加に伴い生産性が課題になる懸念がありました。AD & ADAS 技術 1 部 第 6 技術室 先行技術企画課 担当係長の新原竜馬氏は次のように語ります。
「ADAS のための画像認識では、車、人物、白線、道路標識などを認識します。進化の大きなこの分野では対応シーンの増加や機能の多様化により、モデルの複雑化とモデル数の増加が進んでいます。新製品リリース前の繁忙期になると複数のチームが並行して学習モデルを開発するための十分な GPU リソース確保の調整が難しくなることが予想されました」
加えて、ML 基盤は AI/ML 技術者が内製で構築・運用しているため、サーバーやファイルシステムの管理に工数が取られ、モデル開発に集中できない状況も生まれていました。
もう 1 つの課題は、国際標準規格を満たすトレーサビリティの確保です。近年、ISO などで AI の透明性確保に向けた議論が開始されており、将来を見据えた対応が求められていました。
クラウドエコノミクスによるコスト評価と ML のインサイトを含むサポートが判断の決め手に
既存の GPU クラスタに代わる次世代製品用の ML 学習基盤を検討した同社は、オンプレミスを含めて複数の実現方法を比較した中から、Amazon SageMaker に着目しました。選定の理由は、コスト、使いやすさ、サポートの 3 点です。クラウドサービス開発部デジタルイノベーション-SRE 室の丹羽伸二氏は「AWS のクラウドエコノミクスでオンプレミスと AWS のコストを比較し、さらに SageMaker TCO Calculator で Amazon EC2 の GPU 系インスタンスと Amazon SageMaker を比較した結果、運用も含めた TCO で 20% ほどの削減が見込めることが判明しました」と語ります。
選定に際しては、AWS のソリューションアーキテクトとともに 3 日間の集中討議を実施。構築領域を確定後、約 2 ヶ月間の PoC で技術的に実現が可能であると判断しました。
「AWS のサポートが手厚く、要件定義からアーキテクチャの検討まで、あらゆる相談に乗っていただきました。社内に AWS の ML を活用した知見が少なかったため、AWS のサポートは非常に頼りになりました」(丹羽氏)
ML 開発基盤の構築は 2020 年 7 月にスタート。2021 年 1 月に 1 つの認識物を対象とする ML モデルの本番運用を開始しました。構築では AWS のサーバーレス・マネージドサービスを積極的に活用しています。
また、Amazon SageMaker と AWS Step Functions を利用して ML の CI/CD パイプラインを実現。AWS Step Functions では、Python でワークフローを記述する AWS Step Functions Data Science SDK を採用しました。パイプライン内では前処理、学習、評価といったステップを疎結合で結合し、変更の反映を容易にしています。開発を振り返り、第 6 技術室 先行技術企画課の稲葉正樹氏は次のように語ります。
「モデル精度の向上に向けた試行錯誤が容易にできるよう、パイプラインでモデル学習を実行し、その中でトレーサビリティ情報を取得し Amazon DocumentDB に保存しています。AWS のソリューションアーキテクトと検討した Prototyping をもとに、ML エンジニアが開発しやすいアーキテクチャにこだわって構築しました」
ML で利用するデータは Amazon S3 に集約し、ML エンジニアが必要に応じて Amazon FSx for Lustre に転送。高速処理を実現する Lustre ファイルシステムにより、モデル開発のジョブの処理時間を短縮しています。
Amazon SageMaker による並列処理で学習時間を 3 日から 3 時間に短縮
現在、新たな ML 学習基盤は 1 つのモデル開発で活用中ですが、AI/ML エンジニアからは「トレーサビリティが自動的に確保できる」「繰り返し作業がワークフローで実行できて簡単」「大量データの処理でも最適なノードが選択できる」といった評価の声が届いているといいます。
「ML エンジニアにとってありがたいのは、パイプラインを実行するだけで、機械学習で利用する GPU インスタンスが払い出されることです。コスト管理もしやすいため、日々の利用状況をチェックし、ML の試行段階では安価なスポットインスタンスを使うなどして最適化を図っています」(新原氏)
AWS の活用により、マシン不調の確認、ジョブ管理、リソース調整などはほぼなくなりました。データの集約化でデータエンジニアのデータ管理工数も従来比で 55% まで削減。パイプラインの活用で ML エンジニアによる繰り返し作業の工数も従来比で 66% まで削減でき、期待以上の効果が現れているといいます。Amazon SageMaker による学習ジョブの並列化で、これまで 3 日かかっていた学習の時間が 3 時間に短縮できました。第 6 技術室長の横井健介氏はこれらの成果について、次のように語ります。
「私たちにとって一番重要なことは、データ取得、モデル開発、学習、評価のサイクルを高速に回し、モデルの完成度を高めていくことです。今回、Amazon SageMaker で実現することができました。また、マネージドサービスによる管理工数の削減で、エンジニアリソースが付加価値を高める業務に集中できるようになったことも大きな成果です」
他の機械学習の領域で活用しながらデンソーグループへの横展開も検討
今後は ML 基盤の機能を徐々に追加しながら、2022 年 1 月頃までに 残りの ML モデルの開発基盤をすべて Amazon SageMaker に移行する予定です。また、画像データにタグ付けするアノテーション作業の効率化に向けて、Amazon SageMaker Ground Truth の活用も検討しています。
画像センサーの認識を担当する第 6 技術室以外でも、画像以外のセンサー群(LiDAR 等)についても、ML の活用が広がる可能性があると考えられます。将来的にはインファレンス(推論)にもクラウドの活用を見据えています。横井氏は「AI/ML の領域は、クラウド化が加速していきます。AWS には機能の追加に合わせて、引き続き継続的なサポートを期待しています」と語ります。
横井 健介 氏
新原 竜馬 氏
稲葉 正樹 氏
丹羽 伸二 氏
カスタマープロフィール:株式会社デンソー
- 設立: 1949 年 12 月 16 日
- 資本金: 1,875 億円(2020 年 3 月 31 日現在)
- 売上収益: 5 兆 1,535 億円(連結 2020 年 3 月 31 日現在)
- 従業員数: 170,932 人(連結 2020 年 3 月 31 日)
- 事業内容:モビリティ(エアーコンディショニングシステム、パワートレインシステム、セーフティ&コックピットシステム、自動車補修用部品・アクセサリー、修理サービス)、インダストリー、農業、ホーム
AWS 導入後の効果と今後の展開
- サーバーレス・マネージドサービスにより、機械学習に関するインフラ運用および管理負荷を軽減
- データエンジニアのデータ管理工数を 55% に削減
- 機械学習エンジニアによる繰り返し作業工数を 66% に削減
- オンプレミスで 3 日かかっていた推論を 3 時間に短縮
- 開発サイクルの高速化による新規サービスの早期リリース
ご利用中の主なサービス
Amazon SageMaker
Amazon SageMaker は、すべての開発者やデータサイエンティストが機械学習 (ML) モデルを迅速に構築、トレーニング、デプロイできるようにする完全マネージド型サービスです。
AWS Step Functions
AWS Step Functions は、AWS Lambda 関数および AWS の複数のサービスを、ビジネスに不可欠なアプリケーション内に簡単に配列することができるサーバーレスの関数オーケストレーターです。
Amazon S3
Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。
Amazon FSx for Lustre
Amazon FSx for Lustre は、コンピューティングワークロードに、コスト効率の高い高性能でスケーラブルなストレージを提供するフルマネージドサービスです。