Amazon Neptune ML
簡単、迅速、そして正確なグラフ予測
Neptune の新機能でる Amazon Neptune ML は、グラフ専用の機械学習 (ML) 手法であるグラフニューラルネットワーク (GNN) を使用して、グラフデータを用いて簡単かつ高速で、より正確な予測を行います。Neptune ML を使用すれば、グラフ以外の方法を使用して予測を行う場合と比べて、グラフのほとんどの予測精度を 50% 以上向上させることができます。
数十億の関係を持つグラフで正確な予測を行うことは、困難で時間がかかる場合があります。XGBoost などの既存の ML アプローチは、表形式のデータ用に設計されているため、グラフを効果的に操作できません。その結果、これらの方法をグラフで使用すると、時間がかかるだけでなく、デベロッパーの専門的なスキルが必要になり、生成された予測が最適な結果ではない可能性があります。
AWS が貢献しているオープンソースのライブラリである Deep Graph Library (DGL) を使用すると、グラフデータに深層学習を簡単に適用できます。Neptune ML は、グラフデータに最適な ML モデルの選択と ML モデルのトレーニングという面倒な作業を自動化し、ユーザーが Neptune API とクエリを使用してグラフ上で直接 ML を実行することを可能にします。その結果、新しいツールや ML テクノロジーを習得する必要なく、従来は数週間を要していた ML の作成とトレーニング、および Neptune データへの適用を数時間で行うことができるようになりました。
ML と生成系 AI
ML の専門知識を必要としないグラフデータでの予測
Neptune ML は、ML モデルを自動的に作成およびトレーニングし、グラフデータに適用します。DGL を使用してワークロードに最適な ML モデルが自動的に選択されてトレーニングが行われるため、従来は数週間を要していたグラフデータでの ML ベースの予測を数時間で行うことができます。
ほとんどの予測の精度が 50% 以上向上*
Neptune ML は、グラフデータに適用される最先端の ML 技術である GNN を使用し、グラフ内の十億以上の関係を推論して、より正確な予測を行うことができます。
*スタンフォード大学が発表した研究によると、グラフを使用しない方法と比べて、Neptune ML は GNN を使用して50% 以上正確な予測を行うことができます。
オープンソースの LangChain Python フレームワークでコンテキスト対応のグラフアプリを構築
LangChain は、大規模言語モデル (LLM) を使用するアプリケーションの作成を簡素化するために設計されたオープンソースの Python フレームワークです。Neptune と LangChain の統合により、開発者は LangChain のオープンソースフレームワークを使用して、コンテキスト対応アプリケーションの作成を簡素化できます。
英語の質問を openCypher のグラフクエリに変換し、人間が読める回答を返す
Neptune と LangChain を使用すると、提供されたコンテキストに基づいて応答を返し、openCypher クエリ言語を使用して Neptune グラフデータベースにクエリを実行できます。例えば、Neptune openCypher QA チェーンを使って英語の質問を openCypher のクエリに変換し、人間が読める回答を返すことができます。このチェーンを使用すると、「オースティン空港からの出発ルートはいくつありますか?」などの質問に答えることができます。
Neptune openCypher QA チェーンの詳細については、オープンソースの LangChain ドキュメントを参照してください。
オープンソースの LlamaIndex フレームワークを使用してグラフ検索拡張生成 (GraphRag) アプリケーションを構築
LlamaIndex は、カスタムデータソースを大規模言語モデル (LLM) に接続するためのオープンソースのデータフレームワークで、LLM でのナレッジグラフの使用をサポートしています。
LlamaIndex を使用すると、Amazon Neptune をグラフストアまたはベクターストアとして使用して、GraphRag などの手法を使用してジェネレーティブ AI アプリケーションを構築できます。
ユースケース
不正検出
多くの企業は不正行為によって数百万ドル (場合によっては数十億ドル) もの損失を被っているため、不正なユーザー、アカウント、デバイス、IP アドレス、クレジットカードを検出して損失を最小限に抑えたいと考えています。グラフベースの表現を使用して、エンティティ (ユーザー、デバイス、カード) の相互作用をキャプチャし、1 人のユーザーが複数の少額決済を開始した場合や複数の異なる口座を使用した場合などの潜在的な不正行為の集計を検出できます。
アイデンティティー解決
アイデンティティグラフは、さまざまなデバイスや識別子での製品やウェブサイトとのやり取りに基づいて、顧客に関する単一の一元的なビューを提供します。組織はアイデンティティグラフを使用して、数百万人単位のユーザーを対象にリアルタイムのパーソナライゼーションと広告ターゲティングを行うことができます。Neptune ML は、複数のデバイスにわたる過去の検索履歴や顧客獲得プロセスにおける位置づけなどの特性に基づいて、特定の顧客に次のステップや製品割引を自動的に推奨します。
ナレッジグラフ
ナレッジグラフは、組織の情報アセットを結合および統合して、組織のすべてのメンバーが簡単に利用できるようにします。Neptune ML は、データソース間で欠落しているリンクを推測し、類似のエンティティを識別して、すべてのユーザーがより的確に知識を発見できるようにします。
製品に関するレコメンデーション
従来のレコメンデーションでは、手動で分析サービスを使用して製品に関するレコメンデーションを行います。Neptune ML は、グラフデータから新しい関係性を直接識別し、プレイヤーが購入したいと思うゲーム、フォローしたいと思う他のプレイヤー、購入したいと思う製品のリストを簡単に推奨できます。
仕組み
料金
先行投資は必要ありません。使用した AWS リソース (Amazon SageMaker、Amazon Neptune、Amazon CloudWatch、Amazon S3 など) に対してのみ料金をお支払いいただきます。
開始方法
Neptune ML の使用を開始する最も簡単な方法は、事前構築済みの AWS CloudFormation クイックスタートテンプレートを使用することです。Neptune ML ノートブックを参照して、事前構築済みの CloudFormation スタックを使用したノード分類、ノードリグレッション、リンク予測のエンドツーエンドの例を確認することもできます。