Amazon Web Services ブログ

HawkEye 360 による Deep Graph Libraryと Amazon Neptune を用いた船舶の運航管理リスク予測

この記事はHawkEye 360 の Ian Avilez氏とTim Pavlick氏が共同で執筆しています。

HawkEye 360は、商業用無線周波数 (RF) 信号空間、データ、分析を提供する企業です。その信号には、超短波 (VHF) プッシュツートーク無線機、海上レーダーシステム、AIS(船舶自動識別装置)ビーコン、緊急用ビーコンなどがあります。分析の対象となる信号の種類は年々増加しています。

2021年2月にリリースされた同社の分析プラットフォームであるMission Spaceにより、ユーザーは、RF信号や分析結果を直感的に視覚化することができます。ミッションアナリストは、直感的なインターフェースを通じて、密輸、海賊、違法漁業、人身売買など、目に見えない人間の行動や不正な船舶活動を明らかにすることで、活動を特定し、傾向を理解し、海上の情勢認識能力を向上させることができます。

この投稿では、HawkEye 360とAmazon Machine Learning (ML) Solutions Labが共同で行った、分析ワークフローに機械学習(ML)機能を組み込むための取り組みをまとめています。このコラボレーションには2つのステップがありました。

  1. 世界に登録されているすべての船舶からなるAmazon Neptuneグラフデータベースを作成し、船舶間の関係を把握し、船舶同士がどのように関連しているかを分析します。
  2. Deep Graph Library (DGL)を使って、各船舶のリスクスコアを作成します。この船舶リスクは、他の疑わしい船舶との関連性からリスクを推測し、その船舶がどれだけ疑わしいことをする可能性があるかを、予測するために使用されます。

概要

毎日、何千隻もの船舶が世界を駆け巡っています。アナリストにとって、悪意をもった少数の不振な動きを見つけることは時間がかかり、困難なことです。船舶ネットワークがどのように機能しているかを理解することは、アナリストが自分の地域でどのような船舶の行動が見られるかを判断する上で重要です。このデータは、アナリストが自分たちの近くにいる船舶からどのような疑わしい行動が予想されるかをチームに伝えたり、危険な活動や悪意のある活動をしている船舶がいないかどうかを確認するのに役立ちます。例えば、複数の船舶が運航地域にいる場合、分析者にとっては、それらの船舶が過去に誰と交流していたかが重要なヒントになり得ます。この情報は、対象となる船舶間の直接には見えづらい関係を特定するのに役立ちます。このような船舶ネットワークの関係性の存在は、グラフデータベースと関係性を推論するための深層学習技術との組み合わせに最適なユースケースと言えます。 HawkEye 360は、リレーションシップ情報を格納するグラフデータベースとしてNeptuneを、またグラフニューラルネットワーク(GNN)機能としてDGLを採用しました。

HawkEye 360 のデータには、以下のような船舶の情報が含まれています。

  • 瀬取りの兆候
  • 所有者、管理者、運営関係を含む船舶の情報
  • 長時間、AISから姿を消していた船舶

グラフデータベースとしてNeptuneを使用

Neptuneは、高速で信頼性が高く、完全に管理されたグラフデータベースで、複雑なリレーションシップの保存とミリ秒のレイテンシーでのグラフのクエリに最適化されています。HawkEye 360は、グラフノートブックライブラリが組み込まれたAmazon SageMaker Neptuneノートブックを使用してデータセットを処理し、Neptuneクラスターにロード可能なCSVデータセットを作成しました。 Neptuneデータフォーマットの詳細については、データフォーマットの読み込み を参照してください。グラフノートブックライブラリのJupyterマジック関数%loadを使って、HawkEye 360は、Neptuneクラスタにデータをロードしました。

HawkEye 360は、グラフノートブックライブラリの、%%gremlin関数を使用してGremlinクエリ言語で基礎となるグラフデータを照会することができました。以下の画像は、可視化を伴うクエリの実行例です。

Neptuneを使うことで、HawkEye 360チームは、ネットワーク内の船舶間の隠れたつながりを即座に確認できるようになりました。例えば、アナリストは通常、データ内で互いに影響し合う船舶しか見ることができません。グラフでは、さらに一歩進んで、3ホップ(またはノード)以上離れた船舶間の関係を明らかにすることができます。

HawkEye 360は、Neptuneのデータをもとに、船舶ごとのリスクスコアを作成し、ある船舶が不審な行動をとるリスクを特定しました。これにより、アナリストは対象エリア内のリスクのある船舶を、すべて特定することができます。関心領域のリスクスコアが高いほど、他の悪質な船舶との関係に基づいて、その船舶が悪質な活動に関与していることを示しています。

Deep Graph Library による船舶リスクの予測

船舶リスクを予測するための最初のステップは、グラフデータセットを作成することです。DGLでは、ノードIDデータは0から始まる整数の順序付けされたデータであることを想定しています。このデータセットでは、3種類のノードを使用しています。

  • 船舶ノード
  • オーナー企業ノード
  • 船籍ノード

ノードの種類が異なるため、HawkEye 360では、データの種類が混在することを考慮して、heterogeneous graph を採用しました。dgl.heterograph を用いて、関係性をエッジとしてグラフデータセットを作成しました。heterogeneous graph では、約1%のノードに正解値が設定されました。これらのノードを用いて、HawkEye 360は半教師付きノード分類問題を作成し、船舶のリスクを分類しました。半教師付き学習は,ラベル付きデータとラベルなしデータを含むデータセットで構成されます。データセットのラベル付きデータはモデルの学習に使われ、モデルはラベルのないデータのラベルを予測します。

関係グラフ畳み込みネットワークモデルの学習

データが異種であることから、HawkEye 360はモデルのトレーニングに異種関係グラフ畳み込みネットワーク(R-GCN)グラフアルゴリズムを採用しました。R-GCNアルゴリズムでは、各エッジタイプが異なる重みを使用し、同じ関係タイプrのエッジのみが同じ重みW_rに関連付けられます。HawkEye 360は、R-GCNアルゴリズムを用いて、ノードのサブセットの教師データを用いてモデルをトレーニングし、リスクスコアを持つすべての船舶を見つけて分類しました。

HawkEye 360は、既知の船舶の行動を利用して、未知の船舶の新たな行動を推測することで、インサイトを生み出すことができます。アナリストは、どの船舶が不審な行動をとる可能性が高いかを、既知の不審船舶との関連性から判断することができます。

結論

ML Solutions Lab と HawkEye 360は、Neptuneでグラフデータを構築し、そのデータをモデル化することで、近くにいる船舶のリスクを見つけ出すことができました。NeptuneのグラフネットワークとGNNモデルにより、HawkEye 360は広大な複雑さの海の中で見失われてしまうような船舶間の隠れた関係を明らかにすることができます。これにより、HawkEye 360の新しい主力製品である「Mission Space」は、不審な活動を行う可能性のある船舶を特定し、ユーザーはどこに注目してさらに調査すべきかを容易に判断することができます。

現在、お客様はAmazon Neptune MLを利用することもできます。これは、新しいツールやML技術を習得する必要なく、Neptuneのデータに対するMLモデルの作成、トレーニング、適用を数週間ではなく数時間で行うことができる合理的な方法を提供するものです。

HawkEye 360 の Mission Space の提供については、「Mission Space」をご参照ください。AWSが衛星航空宇宙業界のお客様やパートナーをどのようにサポートしているかについては、AWS Aerospace and Satellite をご覧ください。

製品やサービスへのML活用を加速させるための支援をご希望の方は、Amazon ML Solutions Labまでお問い合わせください。

著者について

Tim Pavlick
Tim Pavlick博士は、HawkEye 360の製品担当副社長です。HawkEyeの宇宙開発における革新的な技術の構想、開発、製品化を担当しています。HawkEye360の主力製品である「Mission Space」は、HawkEye製品のすべてのデータと分析結果を1つの直感的なRF体験にまとめたものです。また、IBMのAIキャリアコーチ「Myca」、退役軍人向けPTSDモニター「Grit」、IBM Defense Operations Platform、Smarter Planet Intelligent Operations Center、インターネット上の危険なヘイトスピーチをAIで検知するシステム、米軍向け電子食品注文システム「STORES」などの発明にも貢献しています。Pavlick博士は、メリーランド大学カレッジパーク校で認知心理学の博士号を取得しました。

Ian Avilez
Ian AvilezはHawkEye 360のデータサイエンティストです。異なるデータセットを組み合わせ、様々な方法でデータを見ることで得られるインサイトを強調するために、お客様と協力しています。

Gaurav Rele
Gaurav Releは、Amazon ML Solution Labのデータサイエンティストで、様々な業界のAWSのお客様と協力して、機械学習とAWSクラウドサービスの利用を加速させ、お客様のビジネス課題を解決しています。

Dan Ford
Dan Fordは、Amazon ML Solution Labのデータサイエンティストで、AWS National Securityの顧客が最先端のMLソリューションを構築するのを支援しています。

翻訳はソリューションアーキテクトの齋藤が担当しました。原文はこちらです。