Amazon Web Services ブログ
寄稿:株式会社 JPX 総研による「生成 AI を活用したオルタナティブデータの価値向上の取り組み」のご紹介
本稿は、日本取引所(以下「JPX」)グループの戦略的なデータ・デジタル事業を担う株式会社 JPX 総研による「生成 AI を活用したオルタナティブデータの価値向上の取り組み」について、アーキテクティングと開発をリードされた箕輪 郁雄 様に寄稿いただきました。
イントロダクション
JPX 総研は、市場全体の機能強化および効率化に繋がるマーケット・サービスの創造を追求することを目的に、2022 年 4 月に子会社として事業を開始しました。主に金融商品市場に関係するデータ・インデックスサービス及びシステム関連サービスを提供しています。
JPX 総研では、JPX のグループ会社及び協業会社(以下「JPX グループ等」)が保有するデータを網羅的にカタログ化して紹介するポータルサイト「JPxData Portal」の提供を行っております。今回は、当サイト内にて提供しているカタログ等の検索機能において、データを蓄積している JPX のデータレイク(J-LAKE)と生成 AI を組み合わせることで、新たな価値を生み出した『既存データ×生成 AI』の事例についてご紹介します。ブログの中では、プロジェクトの背景や AWS の活用方法についても解説いたします。
導入経緯
JPX グループ等では、現在 200 種類を超えるデータ(四本値や売買約定情報など)を提供しており、投資家、証券会社や上場会社を始めとして、幅広いユーザーにご利用いただいております。その一方で、「データの種類が多すぎて探しにくい」、「どのような使い方ができるデータなのか分からない」といったご意見を頂いていました。そこで、ユーザーが求めるデータへのアクセスを容易にするとともに、データの活用方法もご紹介できるよう「JPxData Portal」を提供しております。当サイト内において、投資家が良く利用する適時開示資料及び銘柄の検索機能を提供しており、こちらで生成 AI を活用しております。
ビジネス上の課題
東京証券取引所が提供する適時開示情報閲覧サービス(以下、「TDnet」)において、上場会社が⽇々公表する適時開⽰資料の多くは PDF などのファイル形式で提供されており、TDnet で開示される書類は年間 14 万件、110 万ページ以上あるため、一つ一つの書類に目を通すことは困難な状況でした。また、見たい情報に絞り込みをしようにも、適時開⽰資料の書類タイトルだけでは中身が分からず、銘柄の検索においても、会社名や単一の業種分類からは事業内容を想像しにくい銘柄も数多いため、ユーザーが探したい情報にすぐにはたどり着けませんでした。
ソリューションの概要
上記課題に対して、Amazon Bedrock と AWS Lake Formation を用いて、既存のデータに対して生成 AI によるタグ付けを行うことで新たな付加価値を生み、「JPxData Portal」の適時開示資料・銘柄検索における検索性の向上を実現しました。
- 適時開示文書を Amazon Bedrock に連携し、⽣成 AI(Claude)を活⽤して、ファイル内の文章からタグを生成し、すべての開⽰資料に対して関連するキーワードを付与
- 日々数百件から数千件の適時開示資料があり、マニュアル運用ではタグを付与しきれないため、日々の開示資料の取得、タグ付け、外部連携までの一連の流れをサーバレスアーキテクチャで自動化を実現
- 各銘柄の決算短信資料(適時開示文書の一部)から、Amazon Bedrock の⽣成 AI(Claude) を活⽤して事業タグを生成
- 生成したタグ情報は AWS Lake Formation 配下で管理することで、他システムに対する一元的なメタデータ(データカタログ)の提供を実現し、データの重複保持を排除しつつ、効率的なデータ連携を実現
- これにより、「JPxData Portal」で提供している適時開示資料及び銘柄の検索機能において、タグ情報を用いた検索が可能となり、欲しい情報にたどり着きやすく改善
AWS サービスの活用について
上記機能の実現に AWS の各サービスをどの様に活用したかについて、下図のアーキテクチャ図と共に解説いたします。
- AWS Lake Formation を使用して JPX のデータレイク(J-LAKE)を構築
- AWS Lake Formation によるアクセス管理で、別アカウント下にある Amazon S3 の情報(適時開示情報)に Amazon Bedrock を使用するアカウントからの簡易アクセスを実現
- 適時開示資料を Amazon Bedrock でタグ付けを行い、結果をメタ情報とともに Amazon DynamoDB へ一時保管
- 定期的に Amazon S3 にタグ付け情報を保管した後に AWS Glue でカタログ化し、 AWS Lake Formation で管理される他アカウントから Amazon Athena により簡易にアクセスを可能に
- AWS Lake Formation でアクセス管理された「JPxData Portal」接続用アカウントから適時開示情報と共に、Amazon Bedrock を使用するアカウントにて生成されたタグ情報等を取り込んで「JPxData Portal」で使用
導入効果
ユーザーは Amazon Bedrock にて生成された「持続可能性」や「グッドデザイン」といったタグ情報を利用して検索の幅を広げることができ、目的の開示情報を容易に探せるようになったことに加え、関連する開示等の情報を容易に検索することも出来るようになりました。また、同様に決算短信情報をもとに生成された「事業名」や「サービス名」、「商品名」といったタグを各銘柄に付与したことにより、銘柄の検索性も格段に向上しました。
AWS Lake Formation によるアクセス管理を導入したことで、適時開示資料を Amazon Bedrock にスムーズに連携出来るだけでなく、生成されたタグ等の情報を「JPxData Portal」等の他システムに容易に連携できており、オンプレ時に発生していたデータ連携のための煩わしい運用の排除、データ重複保持の排除といったコストメリットを享受できました。
今後の展望
今後 JPX グループが保有するデータは、J-LAKE に集約していく予定であり、これらのデータに関してはすべて AWS Lake Formation を利用して一元的に管理されていくことになります。当該構成により、社内でのデータ利活用検討が促進され、新たなデータサービス開発が進んでいくと同時にクラウドシフトによる運用の自動化が進んでいくことが期待されます。
また今回の経験をもとに、他のデータに対しても生成 AI を活用していくことで、引き続き新たな価値創出に取り組んでまいります。
執筆者
日本取引所グループ・株式会社 JPX 総研 IT ビジネス部 課長 箕輪 郁雄
大学卒業後、パッケージ開発 IT ベンダーにてプログラマ、DBA 、PM を経験の後、当時の東京証券取引所に入社。ERP パッケージの導入や基幹系システムの新規立ち上げから構築などを担当したのち、現在のデータを活用したシステムの立ち上げ・開発を担当。