法人情報検索データベース『gBizINFO』の基盤に AWS を採用
性能面の課題を解決し、さらなるデータ活用を推進

2021

経済産業省は、行政サービスのデジタル化を推進する法人デジタルプラットフォームの一環として、オープンデータの法人情報検索サービスを提供するデータベース『gBizINFO』の運用基盤に、アマゾン ウェブ サービス(AWS)を採用。グラフデータベース Amazon Neptune を LOD(Linked Open Data)基盤として活用し、全文検索連携機能などによって、クエリ性能の向上も実現しています。

AWS 導入事例  | 経済産業省
kr_quotemark

AWS の採用によって、オープンデータの法人情報検索サービス gBizINFO の性能を大きく改善できました。gBizINFO や認証、行政手続きにかかわるサービスは、国による行政サービスのデジタル化を推進する中で、領域を問わず汎用的な資産として活かされていくものと考えています

細川 義洋 氏
経済産業省
CIO補佐官

デジタル・ガバメントの一環として法人情報をオープンデータ化

経済産業省では事業者向けの行政サービスデジタル化を推進するプラットフォームを『gBizSTACK』と称し、デジタル認証から行政手続き、データ連携、データ分析、オープンデータ / オープンソースに至る一連のサービス・システム構築に取り組んでいます。一部のサービスは運用をすでに開始し、そのほかも本格運用に向けた構築・実証が進んでいます。そのなかで、法人情報検索データベース『gBizINFO』は、最も早い段階(2017 年 1 月)に正式運用が開始されました。

「2015 年 10 月から 1 法人につき 1 つの法人番号が指定されるようになり、さらに 2016 年 12 月に『官民データ活用推進基本法』が公布 / 施行されてオープンデータへの取り組みが重要なテーマとなる中で、行政が保有する法人情報を、法人番号という ID に紐づけて、民間への情報共有を図っていくのが gBizINFO の狙いです」と、経済産業省 CIO 補佐官の細川義洋氏は説明します。

同省では、まず構築したサイトを試験運用したのち、本格運用を開始。その後機能改善を重ねて現在の gBizINFO にサービス名称を変更し、すでに約 700 万件(2021 年 1 月現在)の法人活動データが登録されています。法人番号や法人名で検索を行うと、法人種別や所在地といった基本情報に加え、財務情報や特許、届出・認定、補助金交付、表彰、さらには官公庁における調達など活動情報の閲覧が可能です。加えて、SPARQL(RDF で記述されたデータセットを検索するなどに使用するためのコンピューター言語の一つ)API と REST(Representational State Transfer の略で、分散型システムにおいて複数のソフトウェアを連携させるために適した設計条件)API を実装し、公開された法人情報を 2 次利用しやすいかたちでデータ提供を行っているため、外部サービスなどでもデータ活用できるようになっています。

多くの課題解決に向けシステム構成を模索

gBizINFO 自体のシステムは Web3 階層モデルで構築されており、試験運用を開始した 2015 ~ 2018 年度は、別のクラウドの基盤上でデータベース(DB)サーバーにオープンソースソフトウェア(OSS)のグラフ DB を採用して運用していました。しかし信頼性や可用性、スケーラビリティ、サポート面などさまざまな課題に直面したと、商務情報政策局 総務課 情報プロジェクト室 係長の弘重友就氏は振り返ります。「特に DB に関しては、検索条件によって SPARQL のクエリ実行が長期化し、当省が定めたレスポンス要件を満たせないなどの課題を抱えていました」

そこで同省では、システムインフラの全面的な見直しを実施。2019 年度からは別のクラウド上で、商用 DB のグラフ機能と RDB を稼働させるという構成により、Web アプリケーションと REST API の処理を RDB、SPARQL をグラフ DB でそれぞれ行うようにしました。
「その結果、前システムにおけるいくつかの課題は解消されたものの、コスト高になったことからクラスタ構成をとれず、シングルインスタンスで運用せざるを得ないなど、信頼性の面での問題が残ったほか、DB に関しても依然、性能要件を満たし得ない状況でした」(弘重氏)

Amazon Neptune と Amazon Aurora に移行し課題解消と劇的な性能改善を達成

そこで経済産業省は再度システムの見直しを図り、インフラとして AWS を採用しました。
「選定にあたっては PoC(Proof of Concept)を実施し、性能面の大幅な改善や信頼性、運用性の向上が望めることが確認できました。また、AWS の技術チーム『AWS プロフェッショナルサービス』による手厚い支援が得られること、さらには柔軟なクラウド契約形態やコストパフォーマンスの高さも大いに評価しました」(細川氏)

AWS アジアパシフィック(東京)リージョンで稼働するクラウド向けに構築された高速かつ信頼性の高いグラフデータベースで完全マネージド型の Amazon Neptune、RDB に Amazon Aurora PostgreSQL を選択し、2020 年 7 月にサービスイン。AWS への移行によりコストメリットが得られることで、プライマリとレプリカの 2 インスタンスによるクラスタリングが可能になり、それらを同リージョン内の異なるアベイラビリティゾーンに配置して冗長性を高め、信頼性を大きく向上させることができました。

「ただし、法人番号での検索や詳細情報取得に関するレスポンスは劇的に改善されたものの、法人名だけでも約 500 万件あるデータをシーケンシャルに検索する必要があるため、どうしても遅延が発生していました」と語るのは、商務情報政策局 総務課 情報プロジェクト室でデジタル化推進マネージャーを務める酒井一樹氏です。

法人名検索のレスポンス時間は約 48 秒から 16 秒程度に短縮されたものの、それでも要件に適う成果とはいえませんでしたが、「SPARQL のクエリのチューニングなどを実施することにより、法人名検索のレスポンスが 0.1 秒という圧倒的なスピードを実現できました」(酒井氏)
このように AWS への移行によって gBizINFO の信頼性、性能は大きく向上し、スケーラビリティや可用性、運用をめぐるさまざまな課題を解消することができました。

ユーザーの間で確実に高まるオープンデータ活用に向けた機運

現在、gBizINFO の需要は急速に拡大してきています。そうした中、問い合わせ内容も変化してきていると、商務情報政策局 総務課 情報プロジェクト室でシステム運用を担当する及川有紀氏は語ります。「2019 年までは掲載データの内容にかかわる問い合わせが多かったのですが、2020 年に入ってからは gBizINFO で提供されるデータを自社のシステムやサービスで利用する方法、データの利用規約など、外部サービスへの実利用に関する質問が目立って増えています」

こうした動向からも、gBizINFO の提供するオープンデータを新たなサービス構築に活かしていこうとする機運が確実に高まってきていることが伺えます。
経済産業省では今後も、取り扱う法人データの網羅性を高め、項目の拡充を進めていく構えです。「他の省庁からのデータ収集についても、API 接続によるデータ連携が行えるようにし、効率化を図っていきたいと考えています」(弘重氏)

細川氏は、gBizINFO を含む gBizSTACK 全体の展望について、行政サービス、行政手続きの電子化を核とした「デジタル・ガバメント」に向けた取り組みにおける先導役となり得るものだと捉えていると語ります。
「gBizSTACK 自体は、まだ一部の法人向け行政サービスに閉じたものですが、gBizINFO や認証、行政手続きにかかわるサービスは、国による行政サービスのデジタル化を推進する中で、領域を問わず汎用的な資産として活かされていくものと考えています」 

細川 義洋 氏

弘重 友就 氏

酒井 一樹 氏

及川 有紀 氏


カスタマープロフィール:経済産業省

  • 設置:2001 年 1 月 6 日
  • 年間予算: 1 兆 2,434 億 5,871 万 5,000 円(2020 年度)
  • 定員:7,982 人
  • 事業内容:日本の行政機関の 1 つとして、経済・産業の発展および鉱物資源、エネルギー資源に関する行政を所管

AWS 導入後の効果と今後の展開

  • 信頼性や可用性、スケーラビリティなどの課題をトータルに解消
  • 検索条件によって発生するレスポンス低下を劇的に改善
  • 低コストでクラスタ構成、稼働ゾーンの冗長化が可能に
  • 関係省庁からのデータ収集にかかわる API の活用を推進

ご利用中の主なサービス

Amazon Neptune

Amazon Neptune は高速かつ信頼性の高いフルマネージドグラフデータベースサービスです。このサービスでは、高度に接続されたデータセットと連携するアプリケーションを簡単に構築および実行できます。

詳細はこちら »

Amazon Aurora

Amazon Aurora は、MySQL および PostgreSQL と互換性のあるクラウド向けのリレーショナルデータベースであり、従来のエンタープライズデータベースのパフォーマンスと可用性に加え、オープンソースデータベースのシンプルさとコスト効率性も兼ね備えています。

詳細はこちら »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) は、安全でサイズ変更可能なコンピューティング性能をクラウド内で提供するウェブサービスです。ウェブスケールのクラウドコンピューティングを開発者が簡単に利用できるよう設計されています。

詳細はこちら »

Amazon S3

Amazon Simple Storage Service (Amazon S3) は、業界をリードするスケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービスです。

詳細はこちら »