Amazon Web Services ブログ
Amazon RekognitionとAmazon SageMakerを組み合わせた効率的なAI開発
この投稿は東日本電気エンジニアリング株式会社及び株式会社 JR 東日本情報システムに電気設備の外観検査で撮影した画像の AI 活用の取り組みについて寄稿いただいたものです。
東日本電気エンジニアリングの堀内と申します。当社は東日本旅客鉄道株式会社 (JR 東日本) のパートナー会社として、トロリ線や電柱、信号機や踏切といった線路内の設備から変電所に至るまでさまざまな鉄道電気設備のメンテナンスを行っています。これまで、メンテナンスで撮影された設備の写真はクラウドに一括して保存するだけになっており、活用できていないことが課題になっていました。より効率的なメンテナンス業務の実現を目指し、まずはこの大量に蓄積された写真を、AI で設備を分類し、加えて時系列順にアルバムのように整理できないかと考えました。この AI の開発を JR 東日本情報システムのテクノロジー応用研究センターの方々と取り組んでまいりました。
当初の開発方針として、「基本的なタスクは Rekognition を使って、カスタムが必要なものは Sagemaker で注力する」がありました。これが結果として時間と費用を抑えた AI 開発に繋がったと感じています。
「データはあるけど上手く活用できていない……」同じ悩みを抱える方は多いはずです。そこで、開発を担当してくれたメンバーにお願いして、取り組み内容を執筆していただきました。同じ悩みを抱える方々の参考になれば幸いです。
図:現在の運用とAI活用後のイメージ
Amazon Rekognition
JR 東日本情報システムの方志と申します。堀内氏から提供していただいた設備の写真を確認したところ、いくつかの設備は非常に似ていることに気づきました。 (基本的には) 人が教えるのが難しいタスクは、AI も学習するのが苦手です。ヒアリングしたところ、特に配線箱の中身はメンテナンスの担当者でも写真だけで判定するのは難しいことがわかりました。
図 : 異なる設備の配線箱の中身の例(提供 : 東日本電気エンジニアリング)
そこで本格的な AI 開発の前に、まずは Rekognition のカスタムラベルを使ってどの程度の性能が出るか検証することにしました。Rekognition の使用に機械学習の専門知識は必要ありません。ラベリング済みの写真があれば、WEB 画面の操作だけで AI 開発が可能です。
Rekognition での検証の結果、上記の図(配線箱の中身の例)のようなタスクでも問題なく分類できる※ことがわかりました。
※性能評価は学習、検証、テストデータをそれぞれ 100 枚程度用意して実施、正解率は平均して 90% 以上
一方で分類できない設備もあることもわかりました。分類ができない写真について再度ヒアリングしたところ、形状的に同じ設備であっても用途が異なる場合、設備の分類が変わるため、写真単体では区別できないことがわかりました。
図 : 用途の異なる設備(左右写真)(提供 : 東日本電気エンジニアリング)
どちらも線路ボンド(線路に電気を流す装置)だが、接続先の設備で分類が異なる。
ヒアリングの結果、堀内氏は前後に撮影された設備の画像を見て判断することで、これらをラベリングされていることがわかりました。そこで、AIにも人と同様の情報を処理させる必要があると考え、前後に撮影された画像情報も取り入れることができるAIモデルの開発を行っていくこととなりました。
Amazon SageMaker
JR 東日本情報システムの柴山と申します。一般的な画像分類 AI はラベリングされた 1 枚ずつの画像の特徴を学習して、画像の分類を行います。しかし今回のように前後に撮影された画像の特徴と撮影時間情報を特徴として扱う AI の開発には、専用のアーキテクチャを設計する必要があります。今回は、自然言語処理で良く利用されている LSTM (Long Short Term Memory) と呼ばれる時系列情報を処理できるアーキテクチャと画像処理を組み合わせた伝統的な連続画像処理の手法に、撮影時間の前後情報を処理できるようにカスタマイズしたニューラルネットワークを組み合わせて、一度に複数の画像とそれに紐づく時系列情報を学習させる AI を開発しました。
図 : AI のアーキテクチャ設計図
複数の画像を一度に学習させる AI は、単体の画像を学習させる AI と比較して、当然大きなマシンリソースが必要になります。アーキテクチャの設計はできたものの、学習に必要な GPU のメモリサイズが十分ではなく、開発環境に困っていました。その旨を AWS にご相談したところ、SageMaker での分散学習実行方法の紹介を受けました。この方法は、数行コードを追加するだけでデータ並列処理やモデル並列処理を実装することが可能になります。数行の変更と数回の試行ですぐに実装に移すことができました。複数の画像を一度に GPU メモリに読み込ませないと高速な学習ができない今回の要件には最適でした。
AWS Amplify
JR 東日本情報システムの稲森と申します。堀内氏の要件(大量の写真を AI で分類、時系列に整理する)を叶えるため、下記のようなアーキテクチャを設計しました。
図 : AWS のアーキテクチャ図
認証機能をフルスクラッチで実装するにはかなりの工数が必要です。効率的な開発のため、今回初めてローコードで実装可能な AWS Amplify を採用しました。認証画面の UI も Amplify ライブラリで提供されているコンポーネントを利用したことで、フロントエンド・バックエンドともにスムーズに作成することができました。また、フロントエンドのデザインは Figma で制作しましたが、Amplify は Figma との連携も可能なため、デザイナーと開発者との連携という観点でも非常に効率的でした。
図 : プロトタイプシステム (提供 : 東日本電気エンジニアリング)
システム開発に携わるのは今回が初めて (AWS も初めて) でしたが、AWS は公式のドキュメントも豊富、加えて参考となる書籍やオンライン研修が豊富で助かりました。
まとめ
AI 開発の取り組みをご紹介させていただきましたが、いかがでしたでしょうか ? 今回の検証を通して我々が得た AWS の知見は、下記の通りです。
- Amazon Rekognition
- 実運用に耐える性能を出せる
- AI 開発のファーストステップに有効
(特殊な要件でない限り、Rekognition で解決できる)
- Amazon SageMaker
- 分散学習ライブラリのお陰で、大規模なAI開発に向いている
- AWS Amplify
- 認証、デザイン・バックエンドとの連携がシームレスに可能
- ノーコード・ローコードのお陰で、プロトタイプ開発が効率化できる
以上になります。今回の検証では、AWS のサポートのお陰で、効率的な開発ができました。改めて御礼申し上げます。
最後に宣伝を少しだけ…… JR 東日本情報システムは、2018 年に AI/IoT の応用研究を専門とする部署が発足し、社内外に向けて AI を使った様々なビジネス支援をしています。AI の活用でお困りのことがありましたら、是非我々までご連絡ください。
著者略歴
会社情報
会社名 : 株式会社 JR 東日本情報システム
設立 : 1989年11月24日
所在地 : 東京都新宿区大久保3丁目8番2号 新宿ガーデンタワー7F
URL : https://www.jeis.co.jp/