Amazon Web Services ブログ
【開催報告】AWSで実践!Analytics modernization ~事例祭り編~
2021年6月24日に「AWSで実践!Analytics modernization ~事例祭り編~」を開催しました。今回の事例祭りではAWSのアナリティクスサービスをご活用いただいている株式会社FPパートナー、ANA X株式会社、キリンホールディングス株式会社、株式会社VOYAGE GROUPにご登壇いただき、AWS Japanからはストリームソリューションと売上ダッシュボードの活用例についてお話ししました。本ブログでは各発表内容を紹介します。また、関連資料はこちらからダウンロードいただけます。
AWSのストリームサービスでつくる、データ価値を100倍にするデータ基盤
林田 千瑛 アマゾンウェブサービスジャパン株式会社 アナリティクス ソリューションアーキテクト
ストリームデータは扱うのが難しい、ビジネス価値につなげる方法がわからない、と思われがちですが、Amazon Kinesis を利用することで、簡単にストリームを利用したニアリアルタイム分析環境を構築できます。本セッションでは、最初にバッチ処理で得られるデータとストリーム処理で得られるデータでできることの違い、ストリーム処理で実現できる分析の例を説明しました。
そのあとに、Amazon Kinesis を利用することでどのようにシンプルにストリームデータの収集・蓄積・加工・転送の一連の処理を実現できるかを解説しました。また、アプリケーションやシステムのログ分析環境として、Amazon Kinesis と Amazon Elasticsearch Service を利用するアーキテクチャを解説しました。
最後に、グローバルや国内の業界トップ企業が Amazon Kinesis をどのように利用しているか、事例をいくつか紹介しました。
FPパートナーでデータ活用が急激に加速したターニングポイント
野崎 雷太 様 株式会社FPパートナー 経営企画部
保険代理業と金融商品のファイナンシャルプランニング業務を行うFPパートナーは全社的なデータ活用を Amazon QuickSight で実現しています。営業社員の成績、マーケティングデータ、IT開発の資産計上管理など、用途は多岐にわたり、ほぼ全部署に対して Amazon QuickSight のダッシュボードを共有しています。
全体の構成として、まず自社開発システムで使っている Amazon RDS が中心となり、加えて Amazon Athena 経由の Amazon S3 と直接接続の Amazon S3 もデータソースとして活用しています。ユーザー管理における認証は、社内ユーザーの場合はAzure Active Directory、取引先ユーザーの場合は Amazon Cognito で管理しています。
具体的なユースケースの紹介です。まず営業社員の成績については、Amazon RDS に蓄積された顧客データと社員の行動データを可視化して支社長に共有しています。支社ごとに閲覧できるデータ範囲を制限できるよう、行レベルセキュリティを適用しています。次に、全社員のパソコン棚卸進捗データを収集して各部門の担当者にダッシュボードを共有しています。日次で、 Amazon S3 上にアップロードされた棚卸申告データに対して AWS Glue のクローラーを実行し Amazon Athena に取り込み、 Amazon RDS の社員情報と結合しています。最後に、Redmine上のシステム開発に関するチケットから開発工数を可視化し、このデータを経理部門に提供することで、自社開発ソフトウェアの原価計算をしています。
FPパートナーは営業社員が大半を占めるため、BIツールを駆使したデータ経営は一筋縄にはいきませんでした。BIツール導入前は集計機能を内製していましたが、開発スピードとコストに課題がありました。解決策としてBIツールを導入し、トレーニングを受講してスキルアップも図りましたが、浸透しませんでした。そこで、Amazon QuickSight を採用してやり方を変えました。
まずは全員が利用できる運用に変更しました。従来はBIの利用コストが原因となり一部社員しか利用できない状態でしたが、 Amazon QuickSight の閲覧者は使わなければ料金が発生しない従量課金制であるため、誰でも必要なときに使える環境を準備できました。すると各部署でのダッシュボード利用が雪だるま式に増えていきました。また、社外の取引先にも Amazon QuickSight を通じてデータを無償提供することでサービスの付加価値を高めています。今はBIの費用対効果を過度に意識する必要がなくなったため、データ活用を普及する活動に注力できています。
次に、最初から可視化がリッチなダッシュボードに時間を費やすのではなく、既存の表ファイル運用を移行することから開始しました。すると利用部門はスムーズに Amazon QuickSight を受け入れ、今では新しい可視化の要望も挙がるようになりました。操作性についても高評価です。まずはユーザーが最も必要とする可視化を高速に実現することが成功の秘訣であることが分かります。
最後に、データを利用しやすい形に共通言語化しました。Amazon QuickSight が普及するにつれ、同じ言葉でも部署によって意味が異なることが発覚したため、各データに関して共通認識を持てるよう整備しました。すると Amazon QuickSight 上で行う分析の信頼性が増し、様々な意思決定に活用されるようになりました。
Amazon QuickSight が社内で普及したことで、今後のデータ利活用を促進するための道筋がより明確になりました。まずは体制強化を推進し、データのIN/OUTの品質を更に向上していきます。これを実現すべく、AWSのサービスを更に使い倒していきます。
ANA Xで取り組む顧客起点のデータ分析と、AWSを活用した分析基盤の進化
谷山 徳太郎 様、村松 大輝 様 ANA X株式会社 R&D推進部 データベースマーケティングチーム
ANA X 谷山さま、村松さまより、同社で取り組む顧客起点のデータ分析と、AWS を活用した分析基盤の進化についてご紹介いただきました。
ANA X は ANA グループのプラットフォーム事業会社です。エアラインだけに留まらないグループの非航空収益拡大を目指して、2021年4月に会社組織が再編されました。目指しているお客さまへの提供価値はマイルで生活できる世界です。その世界を実現するにはデータに基づく顧客理解の推進が必要で、現在はデータベースマーケティングチームが顧客分析を推進しています。
スピーディに変化するマーケットニーズに対応できる分析環境が必要であり、このスピード感は ANA X が重要視している価値観の一つです。AWS を採用した主な理由は、分析基盤に必要な一連のサービスが提供され、かつユーザ目線に立ったサービスアップデートが行われる点です。
ANA Xでは、ANA の協力を得ながら、各種データのマーケティング利活用を推進しております。具体的な事例としては、ANAグループが提供するサービスを未だご利用いただいていない ANA マイレージクラブ会員のお客さまに対して、サービス利用意向をスコアリングし、お客さまへのご提案を行っています。
分析基盤はデータサイエンティスト、データアナリスト、業務ユーザが主なユーザになります。基幹系システム、公開データ等をAmazon S3 を活用して蓄積、分析向け DB は主に Amazon Redshift を活用しています。更なる分析活用に向けた基盤進化として、①ユーザ100人の分析を支える仕組み、②統合機械学習環境の実現に取り組んでいます。
リソース問題の解決には Amazon Redshift RA3 を最大限活用し、データ加工処理については完全にコンテナ化をすることで、適時クラスタ立ち上げによるコストダウンや、コンピューティングリソースを独立させることでリソース競合などの問題を解決し、スケーラビリティを向上させています。
Amazon SageMaker の各種サービスの利用、また最近リリースされた Amazon Redshift ML などの新規サービスの導入を検討しながら、データサイエンティストの能力を100%発揮できるような統合機械学習環境の開発に取り組んでいます。
レイクハウスアーキテクチャによる分析の高度化・高速化の実現
進野 耕二 様 キリンホールディングス株式会社
キリンホールディングス 進野さま、NTT データ 柏原さまより、社内のデジタルICTの活用、高度化を推進する上での課題を解決するために、2019年度から取り組まれているデータ活用プロジェクトについてご紹介いただきました。
まずビジネス的な側面から、新たな価値創造と事業全体の生産性向上に向けてデジタル ICT の活用、高度化を進めていく中で、データ活用が重要なポイントになり、IT 面で利用者が効率的に社内外の情報を活用できる環境の整備、事業/情報部門の役割分担・運用ルールを作成するところから始めました。
情報活用プロセス上の課題を解決するために、全社のデータ活用基盤として、社内外のデータを収集・蓄積し、試行錯誤の分析および定期的な実行が可能な環境を構築しています。また利用者を、高スキルな分析部門と一般の業務部門に分けて考え、2種類にユーザを想定して、使いやすい環境を提供しています。また、スモールスタートのアプローチをとっており、日々利用しながら、大きく育てていくこと、基盤のみを提供することで、スピーディ・自由にデータ活用のサイクルを回せるようにしています。
データ活用の高度化、人材育成、強化を実施、更なるデータの拡張、蓄積といった好循環のサイクルを回し続け、キリンのデータ活用の推進を実施していく方針です。(ここまでがキリンホールディングス 進野さまによるプレゼンテーションです)
(ここからが NTT データ 柏原さまによるプレゼンテーションです)
AWS の豊富な実績とサービスの充実性、また Amazon Redshift の性能とメンテナンス性が大きな採用のポイントでした。
また、各構成要素で求められる条件を加味しながら、AWS サービスを選定し、アーキテクチャを設計しました。
分析の高度化、高速化のポイントは3点です。1点目は運用の柔軟性です。分析環境の運用は専任メンバが実施することにより、分析者は分析に集中できる環境を整えました。2点目がレイクハウスアーキテクチャの採用です。Amazon S3 データレイクを中心として、シームレスなデータ移動、ユースケースに応じた分析ができる環境を整備しました。3点目は新サービス採用および活用です。もっとも重要なポイントの一つで、日々進化するAWSサービスのアップデートをキャッチアップし、日々環境をブラッシュアップしています。また、本プロジェクトを通じたベストプラクティスは下図のとおりです。
今後は環境全体を Amazon Redshift RA3 インスタンスに変更したり、データシェアリングや Redshift ML などの機能(SQL で 機械学習モデルの構築、トレーニング、推論を実施)の活用を検討していく予定です。
ぼくのかんがえる最高のレポーティング基盤
近森 淳平 様 株式会社VOYAGE GROUP Zucks AP 事業本部 エンジニア
株式会社VOYAGE GROUP 近森様より、増え続ける分析要件、特に1日あたり数億件以上もの大規模データが生まれる環境において、AWSのサーバーレスサービスを活用したスケーラブル&マネージドなレポーティング基盤に再構築した事例についてご紹介頂きました。
従前の構成では、ラムダアーキテクチャを意識し、既存の Google BigQuery / AWS Fargate (Fargate) / Amazon Aurora を中心としたバッチレイヤと Amazon Kinesis Data Streams / Amazon Kinesis Data Analytics / Amazon Aurora を中心としたスピードレイヤの2系統に分割されていましたが、これらが分割されていることによるバッチレイヤーとスピードレイヤー間での結果不整合、精緻なデータを有するスピードレイヤでの分析軸の追加変更に課題があり、冪等性が担保できていなかったことがペインでした。また、アーキテクチャに依存しない課題として、ビジネスプロセスを含めたモデリングに課題がありクエリが作りづらいといった悩みもございました。
そこで、まずはアーキテクチャに対する課題に対して、Amazon S3、Amazon Redshift (Redshift)、AWS Lambda、Fargate といったマネージドサービスを活用し、アーキテクチャのシンプル化を図られたといいます。従前の複数系統に分かれているがゆえの結果不整合を回避し、Redshift を中心として冪等性を担保しつつ、高速なレポーティングを実現していただけました。ここでのポイントは、レポーティング業務において、特定の行ではなくむしろ特定の列が重要であり、列指向の Redshift と相性が良かったことをポイントとして挙げられておりました。
一方で、近森様は、レポーティングにおいて、本質的にクエリが複雑になってしまう要因に、データウェアハウス製品を何にするかは関係ないとも言います。
クエリが複雑になる要因として、本質的にはその背後にあるビジネスプロセスを反映したデータのモデリングがなされていないことを言及されました。その解決策として、特にレポーティング業務においてはディメンションモデリング、スタースキーマが有効であることを示されました。VOYAGE GROUP 社のスタースキーマで設計されたデータに対するクエリは、リザルトキャッシュ等の機能を有効に活用し、Redshift 上で高速に動作していることについても触れていただきました。
また、レポートで適切な値を取得できなくなるケースについては、2 つのパターン、すなわち、WHERE 句の誤り・ファントラップの発生が代表的であることを挙げ、その上で本番データでの検証が重要ということで、Redshift のデータ共有機能の活用の可能性も示していただけました。
Amazon QuickSight を活用した売上データ分析ダッシュボードのご紹介
大薗 純平 アマゾンウェブサービスジャパン株式会社 アナリティクス ソリューションアーキテクト
アマゾンウェブサービスジャパン株式会社大薗より、大規模なデータ量・ユーザー数に対応するサーバーレスな Business Intelligence(BI) サービスである Amazon QuickSight を活用した売上データ分析ダッシュボードを、デモを交えてご紹介しました。
データを分析してビジネスに活かしていくために、蓄積されたデータを可視化し把握することが重要であることは広く認識されていますが、「どのような可視化・分析を行えばビジネスインサイトを得られるか分からない」「表計算ソフトに慣れており、BI ならではの効果的な表現が分からない」といった声も多く聞かれます。そういったニーズに対し AWS では、売上データ分析で頻繁に使われる可視化パターンを盛り込んだダッシュボードを Amazon QuickSightのギャラリー 内に公開しています。本セッションでは実際にこのダッシュボードを使い、分析のためにはどのような表現方法が効果的か、そしてどのような分析手順でインサイトを抽出するかステップを踏みながらデモをお見せしました。当日のデモの内容は、Amazon Web Services Blog Amazon QuickSightのBIダッシュボードで小売りデータを分析するにて詳しく解説していますのでご参照ください。
デモの後は、ダッシュボードの裏側を支えるサービスとして Amazon QuickSight の特徴、先進的な機能、料金体系などをご紹介し、最後に Amazon QuickSight をはじめていただくために最適なコンテンツとして、基礎的な使い方の習得をサポートする Amazon QuickSight のセルフハンズオンキット (3種類)、 Amazon QuickSightの設計や運用のノウハウをまとめた Amazon QuickSight のノウハウ総まとめ! 〜BI設計から運用まで〜 をご紹介してセッションを締めくくりました。
まとめ
分析基盤の構築とデータ活用の浸透における事例が盛り沢山なセミナーでした。サービスラインアップが豊富なAWSであれば、現代のニーズと合致したデータ分析環境を柔軟に組み立てることができます。AWSサービスにご興味ある場合は無料で個別相談会を開催しておりますので、皆様からのお申込みをお待ちしております。お申込みリンク。
アナリティクス事業本部 事業開発 伊東 大騎