Amazon Web Services ブログ

寄稿:生成 AI で“探せなかった開示情報”を見つけ出す 〜 JPX の AI 開示情報検索サービス J-LENS〜

本稿は、日本取引所(以下「JPX」)グループの戦略的なデータ・デジタル事業を担う株式会社 JPX 総研による「生成 AI で“探せなかった開示情報”を見つけ出す 〜 JPX の AI 開示情報検索サービス J‑LENS 〜」について、アーキテクティングと開発をリードされた 太子 智貴 様に寄稿いただきました。

イントロダクション

上場企業が日々開示する適時開示情報は投資家による投資判断だけでなく、企業担当者における同業他社分析・市場動向の把握に活用される重要な情報源となっています。一方で、この開示資料の量は膨大であり、年間で 10 万ページ規模にのぼる情報の中から、関心のあるテーマや企業に関する記載を素早く見つけるのは容易ではありません。加えて、開示資料は年々増加・高度化しており、投資家や企業担当者にとって「必要な情報にいかに早く、正確に辿り着けるか」は大きな課題となっています。
従来型のキーワード検索では、表記ゆれやあいまいな表現、否定形を含む記載などを適切に拾いきることが難しいケースも少なくありません。

こうした課題を解決するため、JPX では、生成 AI を活用した AI 開示情報検索サービス 「J-LENS(ジェイ・レンズ)」 を開発しました。
本記事では、J-LENS の背景、仕組み、技術的な工夫、そして今後の展望について紹介します。

会社・サービス紹介

日本取引所グループ(JPX)は、東京証券取引所・大阪取引所などを運営し、日本の金融市場インフラを支えています。その中で 株式会社 JPX 総研 は、データとテクノロジーを軸に、市場参加者の利便性向上や新たな付加価値創出を目的としたサービス開発を担っています。

今回紹介するサービスの J-LENS は、この JPX 総研が中心となり開発した、上場企業の適時開示情報等(TDnet 開示情報)を対象とした AI 検索サービスです。

J-LENS を使ってみる

課題

日本市場に関心のある投資家が上場企業について理解を深めようとする際、参照すべき情報は多岐にわたります。決算短信を始めとした財務データ、製品情報等のニュース、株主や投資家向けの決算説明資料、業績予想等の適時開示資料など、企業に関する情報は豊富に存在している一方で、それらは複数の開示資料に分散しています。

そのため、投資家は「この企業の成長領域は何か」「直近の業績変化の要因は何か」「事業上のリスクはどこにあるのか」といった関心に応じて、複数の資料を横断的に確認し、必要な情報を探し出す必要があります。

しかし、従来の検索手法では、適切なキーワードを自分で考え、検索結果から関連する資料を選び、さらに資料内の該当箇所を読み解く必要があります。また、同じ意味を持つ用語でも、「TOB」と「公開買付け」のように資料によって表記が異なる場合があり、検索語の選び方によっては必要な情報を見落としてしまう可能性もあります。
特に企業比較や過年度比較などを把握したい場合には、情報収集と整理に大きな手間がかかります。

こうした背景から、投資家が自然な問いかけを起点に、信頼できる企業情報へ効率的にアクセスし、理解を深められるような新しい情報探索体験が求められています。

ソリューション

こうした「膨大で分散した開示資料から、意図に合う情報へ自然に辿り着きたい」という課題に対し、JPX 総研では生成 AI を活用した AI 開示情報検索サービス 「J-LENS(ジェイ・レンズ)」 を開発しました。
J-LENS は、ユーザーが入力した自然な文章の質問を起点に検索できるよう設計しており、従来のキーワード検索で生じやすい表記ゆれ等による探しづらさの低減を狙っています。
また、生成 AI による検索意図の解析により日本語以外の入力にも対応しており、ブラウザの翻訳機能等と組み合わせることで、海外ユーザーにも利用しやすい情報探索体験を提供します。

技術的詳細

活用した主な AWS サービス

J‑LENS の基盤には、主に以下の AWS サービスを採用しています。

  • Amazon Bedrock
    生成 AI を活用し、検索クエリの意味理解や回答生成を実施
  • Amazon OpenSearch Service
    開示資料をベクトル化し、意味的類似度に基づく検索を実現

検索精度向上のための AI 補助処理

Step1:開示資料の収集・分割

JPXが保有するデータレイク(J-LAKE)より、決算短信やコーポレート・ガバナンス報告書などの開示資料を収集し、検索に適した単位に分割します。開示資料はページ数や構成が資料ごとに異なるため、単純な固定長分割ではなく、開示種別に応じた内容のまとまりを意識して、分割を行う必要があります。
例えば、決算短信やコーポレード・ガバナンス報告書などはページ数が多く、比較的資料構成が決まっているのでセクション単位で分割し、業績や配当予想の修正のような短い開示資料は開示単位で分割するなど、分割粒度と分割手法も資料種別に応じて切り替えており、後続の検索や要約に活用しやすい形に整えています。

Step2:生成 AI による企業・資料の分析

検索精度を高めるため、資料自体の特徴を分析し、テーマや企業属性に関するタグ情報を付与します。あわせて、各企業の事業内容や特徴に関する情報もメタデータとして整理します。これにより、本文中に明示されていない企業属性や関心テーマも検索に活用しやすくなります。

Step3:Amazon OpenSearch Service への登録

分割した本文情報に加え、フィルタリング条件や画面表示に用いるメタデータをあわせて Amazon OpenSearch Service に登録します。本文の意味情報と構造化された情報を組み合わせることで、自然文検索と条件指定の双方に対応できるようにしています。

Step4:ユーザーの自然文クエリを解析

ユーザーが入力した質問に対して、生成 AI が検索意図を解析します。例えば、対象企業、業種、期間、テーマなどを推定し、Amazon OpenSearch Service で検索しやすい形に整理します。これにより、ユーザーの質問をそのまま検索するだけではなく、検索対象を適切に絞り込むことができます。

Step5:構造化フィルタとベクトル検索の併用

検索期間、上場市場、業種、開示項目などの構造化フィルタと、意味的な近さに基づくベクトル検索を組み合わせて検索を実行します。膨大な開示資料の中から、検索意図に合う可能性の高い資料群に対象を絞り込むことで、関連性の高い結果を得やすくしています。

Step6:検索結果の整理とリランキング

Amazon OpenSearch Service から取得した検索結果に対して、検索クエリとの関連性や重要語句などを踏まえて結果を整理・リランキングします。単純なベクトル検索だけでは上位に出にくい資料もあるため、AI を用いて企業名・業種・市場区分・商品名などの重要情報を検索文から抽出し、各チャンクに付与されたメタデータと照合しながら、検索結果を再評価しています。これにより、利用者の検索意図に近い結果をより高い精度で提示できるようにしています。

Step7:回答理由の提示

検索結果とともに、なぜその資料が関連すると判断されたのかを表示します。これにより、利用者は検索結果の妥当性を確認しながら、該当する適時開示資料の本文に進むことができます。また、回答だけに依存せず原文確認につなげることで、事実と異なる回答の抑制にもつなげています。

効果・成果

情報探索の効率化(“探す”から“辿り着く”へ)

J-LENS により、投資家や企業担当者は、膨大な開示資料の中から関心テーマに基づく情報へ短時間で到達しやすくなりました。検索結果には資料本文へのリンク、タイトル、開示日等に加え、検索結果が選ばれた理由が提示されるため、内容確認や比較確認にかかる負荷の軽減にもつながります。

単純なベクトル検索だけでは拾いきれない“意図”への対応

開示情報の探索では、本文中の語句の近さだけでなく、「その開示を提出した企業がどのようなビジネスを行っているか」が判断材料になります。たとえば「生成 AI 関連サービスを提供する企業の業績動向」を調べる際、本文に「生成 AI」という語が含まれるかだけでは十分ではなく、システム開発、SaaS、データ分析、業務自動化といった事業領域を踏まえることで、検索意図に近い企業の開示情報を見つけやすくなります。
同様に「海外展開を強化している企業」を探す場合も、本文表現だけでなく、海外売上比率や海外子会社の有無、グローバルな製造・販売網といった企業ごとの事業特性を踏まえることが重要です。

そこで J-LENS では、各企業の事業内容や特徴を生成 AI であらかじめ分析し、検索時に開示資料本文の内容と組み合わせて評価します。さらに、ユーザーの検索クエリについても生成 AI で質問意図を解析し、検索対象となる企業群や資料群を絞り込んだうえで検索を行うことで、膨大な開示資料の中から関心により近い企業や開示情報を上位に提示しやすくしています。

“想定外の発見”と、定性的情報の横断比較を後押し

単純なキーワード一致に依存せず、文脈や意味に基づいて関連情報を抽出することで、従来の検索では見落とされがちであった情報に加え、ユーザーが事前に想定していなかった企業や観点の新たな発見にもつながります。
また、従来は人手で複数資料を読み比べる必要があった定性的な情報についても自然文で横断的な検索が可能となり、投資判断や企業分析における初動調査の効率化が期待できます。

海外ユーザーの利用性

生成 AI による検索意図の解析により、日本語以外の入力にも対応しており、ブラウザの翻訳機能等と組み合わせることで、海外ユーザーにとってもスムーズな情報探索が可能です。

今後の展望

さらなる生成 AI 活用の拡大

J-LENS は現在 β 版として公開しており、利用者からのフィードバックを踏まえながら継続的な改善を進めています。

「検索精度・回答品質のさらなる向上」、「フィルタ機能や検索履歴などの利便性向上」といったフィードバックを踏まえた改善策に加え、ユーザの検索ログ・アクセスログに鑑みたサービスの提供も予定しています。

今後提供するサービスでは、単に情報を「探す」だけでなく、検索結果を起点に企業を「比較・分析し、深く理解する」体験へと進化させていきます。

具体的には検索によって抽出された企業について、事業内容の整理や特徴の深掘り、業界内での位置づけの可視化、類似企業との比較といった分析を可能とすることで、従来は人手に依存していた企業分析プロセスを高度化し、意思決定をより効率的に支援することを目指します。

これらの分析知見の抽出や整理にも生成 AI を活用することで、ユーザーが自然な問いかけを通じて開示検索をきっかけにより深い企業理解を得られる環境の実現を目指します。

執筆者

J-LENS 開発担当(左から、株式会社 JPX 総研 フロンティア戦略部 斎藤裕哉、三村優里香、IT ビジネス部 太子 智貴)