1988 年に親会社である三菱UFJ信託銀行の 100 % 出資により設立された株式会社 三菱UFJトラスト投資工学研究所(MTEC)は、国内初の金融工学に特化したシンクタンクです。以来、最新の金融工学や投資理論の知識/技術を駆使して、親会社および三菱UFJフィナンシャルグループ(MUFGグループ)のグループ会社の依頼にもとづき、株式や債券の資産運用、市場リスク/信用リスクの管理、デリバティブのプライシングといった研究開発を行ってきました。これらの研究開発から生まれた資産運用モデルやリスク管理モデルをソリューションとして親会社およびグループ会社に提供しています。

当社ではこれまで研究対象として、個別企業の売上や財務といった数値データを中心に扱ってきましたが、ここ数年における激しいビジネス環境の変化に伴い、新たな分析対象となるソースを探す必要性が生じておりました。そうした中、テキスト情報を中心とする非構造化データ (非数値データ) に着目し、経済ニュースから株式市場との関連性を見出すテキスト情報の利用可能性について検討を始めました。

その結果、とりわけ国内株式の資産運用においては、経済ニュースからキーワード (景気、上がる/下がるなど) をテキストマイニングで抜き出し、市場心理がポジティブであるかネガティブであるかを定量化し、有効に活用できると判断しました。

ビッグデータである経済ニュースからキーワードを抜き出し、日次で収集/蓄積/分析するには、そのためのインフラ環境の構築が必要となります。このため、インフラ基盤の検討を 2014 年 7 月より開始いたしました。

mtec_photo02

「金融のクラウド事例がひとつひとつオープンになることで、日本の金融業界が活性化し、その輪が社会全般にも拡がることを願っています。」

- 株式会社 三菱UFJトラスト投資工学研究所 研究部 次長 森谷 進吉 様
- 株式会社 三菱UFJトラスト投資工学研究所 研究部 開発第2グループ フィナンシャルエンジニア 阿部 一也 様

 

本システムを構築するにあたって、自前でサーバーなどのハードウェアを調達するオンプレミス環境も事前に検討しましたが、ハードウェアの初期投資コストに加え、調達までに数カ月もの時間がかかるという点がボトルネックでした。親会社からはできるだけ早い段階で本システムをビジネスに活かしたいという要望を受けており、調達や開発に長い期間を要する事態は可能な限り避ける必要がありました。

また、自社内でインフラを構築する場合、サイジングをいかに的確に行うかという点も課題でした。日々膨大なデータ量となる経済ニュースのようなビッグデータを扱うにあたって、オンプレミス環境で事前にハードウェアのリソースを適切に見積もるのは現実的にも非常に困難だと考えました。

これらの課題を検討した結果、本環境にはオンプレミスよりもクラウドのほうが適しているという結論に至りました。そこでいくつかのクラウドサービスの検討を開始したのですが、その際、考慮したポイントは以下の4点です。

1. 「早く」(構築期間)
2. 「安く」(コスト)
3. 「柔軟に」(リソース調達)
4. 「安全に」(セキュリティ)

「ビッグデータ分析という新たな研究成果をできるだけ早く資産運用ビジネスに活用する。」この目的を達成するためには、いかに「早く」かつ「安く」インフラ環境を構築し、多様なクラウドサービスを有効に利用しつつ、ランニングコストを抑えた運用/保守を実現するかが最大のポイントでした。

また、日々大量に発生するビッグデータに対し、ハードウェアのリソースを「柔軟に」調達し、短時間で処理できる環境であることも必要です。さらに、当然のことながらクラウドのセキュリティレベルが当社および親会社のセキュリティ基準に準拠しており、「安全に」運用できる点も外せないポイントでした。

これらのポイントをすべて十分なレベルで満たしていたクラウドサービスが AWS でした。特にイニシャルコストに関しては他社と比較してその優位性が突出していました。また、利用可能なクラウドサービスのメニューが非常に豊富であったことも AWS を選んだ決め手のひとつです。さらに、セキュリティに関して FISC が作成する「金融機関等コンピュータシステムの安全対策基準」に対する対応状況を確認でき、また、第三者機関の認証を AWS が数多く取得していることも当社にとっては重要でした。当時、金融機関の利用に耐えうるかどうかのチェックシートを提供していたクラウドサービスは AWS だけで、これは経営層の承認を得る際にもプラスに働きました。

こうして、クラウドの検討を開始してから 2 ヵ月後の 2014 年 9 月に AWS の導入を決定しました。

jp_diagram_mtec_1024x842

本システムの開発は 2014 年 10 月からスタートしました。開発体制は外部のパートナー企業も含めて 20 名ほどでしたが、AWS 全体のアーキテクチャ設計も含めて、わずか約 2 ヵ後の 2014 年 12 月前半にはほぼ完成形に近いものができました。

今回構築したシステムの概要をあらためて説明すると

・日々発生する経済ニュースをクラウドで受信
・経済ニュースから市場心理(ポジティブ/ネガティブ)を判定
・売買する株式銘柄を選定

という連続的な処理を、サーバー単位の分散/同期処理を組み合わせ、自動的かつ短時間で実行するインフラとなります。

1 日に扱うデータ量は約 35 万件/ 1.5 GB ほどですが、過去のデータも含めると 1 TB ほどのデータをつねに参照できる状態にしておく必要があります。また、頻繁に参照するデータと、それ以外に一定期間格納するデータがありますが、AWS はこれを簡単な設定で制御することができます。

本システムの開発環境においてもクラウドを活用しましたが、やはりサーバーを柔軟に用意できるという点は非常に高く評価できると思います。「サーバーを一気に 100 台用意して、過去約 10 年分のデータを作成し続ける」といったオンプレミスでは難しい調達も簡単にでき、リソースを柔軟に割り当てながら開発を行うことができたのは、大変助かりました。

ひとつだけ苦労した点としては、サーバーの分散/同期処理を制御する Amazon SWF による開発でした。Amazon SWF については日本ではまだ導入事例や情報が少なく、技術的な課題解決が難しかったのですが、Amazon のサポートを受けながら完成させることができました。ただし、今であれば似たような仕組みを「AWS Lambda」などで実現可能かもしれません。

テストなどを終え、正式に親会社を運用者とする「ビッグデータを活用した国内株式運用ファンド」として活用を開始したのは 2015 年 2 月です。インフラ構築を含め約 4 ヵ月という短い期間で立ち上げることができたのはクラウドを利用した最大の効果だったといえます。先にも申し上げましたが、サーバーの調達が本当に柔軟にできるので、開発リソースが足りなくなるということは一切ありませんでした。

クラウドがさまざまなコストを圧縮することはもちろん聞いていましたが、実際に「使った分だけしか払わなくていい」「コスト設計に上積みする必要がない」という感覚はかなり驚きでした。本当にサーバーが動いた分しか払わなくていいので、逆にバッチ処理が終了したらサーバーの稼動をすぐに停止させるように気を付けています。イニシャルコストおよびランニングコストは年間で 30 % 程度削減できており、運用面でもハードウェアのリソースを柔軟に調達できるので、ビッグデータのデータ量の制約を受けることなく、迅速で安定した処理を実現できています。

今回の成果をベースにして、当社ではテキスト分析の研究対象をさらに拡げ、経済ニュースだけでなく、企業の有価証券報告書や決算短信報告書などもソースとして扱い、信用リスクを予測するリスク管理の分野にも活用したいと考えています。また、テキスト情報以外にも、ミリ秒単位の株価データを対象としたディープラーニングなどを利用する応用研究も進めています。これに伴い、Amazon Redshift、Amazon Elastic MapReduce などマネージド型のビッグデータサービスの検討も開始しました。

さらに、近年では金融と IT を組み合わせた「FinTech」と呼ばれる分野で様々なサービスが登場しておりますが、これら「FinTech」の分野でも我々が今まで培った金融工学のノウハウを活かす方法を模索しています。

今回、非常に満足度の高いシステムを構築することができましたが、AWS には開発者だけでなくビジネスユーザーにも使いやすいユーザエクスペリエンスを提供してもらえたらと思っています。

金融業界の事例公開はデータの性質やコンプライアンスの観点から難しいとされがちですが、それを理由に閉じたままでは世の中の変化に追いつくことはできません。当社が構築したようなオープンなデータを使った事例なら公開の障壁も低くなるのではないでしょうか。

今回、当社がこの事例を公開したのも金融業界においても AWS のようなクラウドサービスをよりスムーズに使える世の中になってほしいからです。金融のクラウド事例がひとつひとつオープンになることで、日本の金融業界が活性化し、その輪が社会全般にも拡がることを願っています。

 

- 株式会社 三菱UFJトラスト投資工学研究所 研究部 次長 森谷 進吉 様
- 株式会社 三菱UFJトラスト投資工学研究所 研究部 開発第2グループ フィナンシャルエンジニア 阿部 一也 様