分析基盤を使わない時間帯に Amazon Redshift のサービスを自動的に停止したり、無駄なリソースを使わないように運用したりすることで、
5 年間のトータル運用コストはオンプレミス環境と比べて 50% 以上は削減ができると見ています。

太田 雅 氏 株式会社ビデオリサーチ IT・技術推進局 IT1 部長 兼 管理グループ 課長

 

国内唯一のテレビ視聴率調査会社として、1962 年から半世紀以上にわたってメディアリサーチサービスを提供するビデオリサーチ。生活者の価値観やライフスタイルも大きく変わる中、現在は視聴率の調査だけに留まらず、人々の生活スタイルや嗜好、購買行動などに関するさまざまな調査を実施し、テレビ局や広告代理店などに価値を提供しています。

同社の主力サービスである視聴率調査では、調査協力世帯(モニター)の「誰が、いつ、どの番組を視聴したか」のデータを地域ごとに取得します。それらのデータは堅牢なホストシステムに蓄積されており、必要に応じてデータを抽出してデータウェアハウス(DWH)上に展開し、加工したデータや同社で分析した結果をお客様に提供しています。

同社は 2016 年 10 月から従来型の視聴率に加え、録画番組の視聴率「タイムシフト視聴率」の調査を開始しました。タイムシフト視聴率用の DWH は、2012 年に導入したアナリティックアプライアンスの「IBM Pure-Data System for Analytics」(旧名称:IBMNetezza)を利用していましたが、既存のDWH 基盤が導入から 5 年が経ち、保守切れの期間を迎えようとしていたことから、新たな DWH 基盤の検討を開始しました。「既存のアプライアンスを更新するか、クラウドサービスを採用するか、2 つの選択肢がありました。アプライアンスは満足度が高かったものの、基幹系の領域にもハードウェアを持たずにコストを最適化したいという意識の高まりがあったため、クラウドサービスを移行することにしました。」と語るのは IT・技術推進局 IT1 部長 兼 管理グループ 課長の太田雅氏です。

 

複数のクラウドサービスを検討する中で、同社が採用したのが Amazon Redshift です。IT・技術推進局 IT1 部 第 1 グループの辻水月氏は次のようにその理由を語ります。「まずはリソースの拡張性と使いやすさです。制限があるアプライアンスに対して、クラウドは実質無制限の拡張性を持ち、事前にサイズを確定させる必要がありません。将来的に視聴率調査の分析範囲を拡大する際も、簡単に対応が可能です。決め手となったのは、当時検討したクラウドサービスの中で、既存の予測分析ソフトの IBM SPSS が利用できるのは Amazon Redshift だけだったことです。」

構築パートナーには既存システムの導入ベンダーであり、同社が商用系のクラウドサービスで導入した AWS の環境構築を手がけた実績もある伊藤忠テクノソリューションズ株式会社(CTC)を選定し、PoC(概念検証)に着手しました。「従来からの実績と信頼性、運用面でのメリットから迷うことなく CTC に依頼しました。」と太田氏は話します。

PoC では性能検証、既存 SQL 検証、データ移行方法検証の 3 つを実施しました。PoCと並行して AWS のチューニングポイントのレクチャーなどを受けました。その結果、既存システムとほぼ同等レベルのパフォーマンスが得られることを確認し、2017 年7 月より Amazon Redshift の環境構築に着手しました。2 ヶ月後の 9 月からは既存のオンプレミス環境と並行稼働してテストを実施しました。並行稼働中は、ユーザーのトレーニング期間とし、動作を確認して操作に慣れた段階で 2017 年 12 月に完全移行しました。

導入・移行作業は PoC でリスクを洗い出しながら進めたこともあり、大きなトラブルもなく順調に進んだといいます。「工夫したことは、ネットワークを圧迫しないように約 20TB のデータを数 GB に分けて Amazon S3 にアップロードした程度で、スムーズに構築ができました。CTC には視聴率データを保管してあるホストシステムから分析データを抽出する Amazon Redshift との連携部分の ETL ツールの作り込みを中心に支援をいただきました。プロジェクトの進め方も丁寧で、計画通り完了ことができました。」(辻氏) 

Amazon Redshift をベースした分析基盤は、関東地区のタイムシフト視聴率の分析用途として利用を開始しました。現在は、分析者からの要望に応じて関西地区、名古屋地区のタイムシフト視聴率の分析のほか、その他の調査の分析にも利用が拡大されています。これらの要望に柔軟に対応でき、常に高いパフォーマンスを維持できるのは、容易にリソースのスケールアウトができるクラウドサービスならではのメリットです。「現在は、40 ノードで 4 つのクラスターを構成し、古いデータは 1 つのクラスターで保管してコールドスタンバイで運用しています。従来はユーザーからリソースの増強をリクエストされると、使わないデータを他のディスクに一時退避して応えていました。現在は要望に応じて約 1 日でリソースの提供が可能です。今まではハードウェアの制限であきらめていたことが、AWS であれば可能になったという意識が生まれ、最近は 6TB 級の超大量データの分析にも利用されています。」(辻氏)

コスト面でも効果が大きく、オンプレミス環境のデータセンターコストが不要になったほか、運用コストの最適化が実現しました。「分析基盤を使わない土曜、日曜や平日の深夜帯に Amazon Redshift のサービスを自動的に停止したり、無駄なリソースを使わないように運用したりすることで、5 年間のトータル運用コストはオンプレミスと比較して 50% 以上は削減ができると見ています。」(太田氏)

メンテナンスの負荷も軽減され、クラスター作成や起動停止もコンソールからの対応となりました。従来のように運用スタッフがデータセンターに駆け付ける必要もありません。運用以外の業務に人的リソースが割けるようになりました。

今後については、Amazon Redshift をさまざまなシステムと連携することによって外部データを利用した分析へと拡張し、ビッグデータの分析にもチャレンジしながらデータの価値を高めていく方針です。「現在はテレビの視聴率が中心ですが、最近はインターネットの普及などにより、Web データとテレビ視聴率の関連性の調査や、他社の持つさまざまなデータと組み合わせた調査依頼が増えています。当社のスローガンとして“提供から提案まで”と掲げているように、お客様に新たな提案ができるようにビッグデータの分析を進めていきます。そのためのツールとして、Hadoop 基盤の Amazon Elastic MapReduce にも注目しています。」(太田氏)

同社のクラウドファーストへのシフトは今後も進んでいきます。

videoresearch_ohta

太田 雅 氏

videoresearch_tsuji

辻 水月 氏

 

AWS プレミアコンサルティングパートナー
伊藤忠テクノソリューションズ株式会社

AWS 移行に関して優れた実績・専門的スキルがあることを AWS が認定する「移行コンピテンシー」と今回利用している Amazon Redshift に関する経験と深い知識があることを認定する「Redshift のサービスデリバリープログラム」を有している APN パートナー最上位の「プレミアコンサルティングパートナー」

CTC_300x200
PDF 版のダウンロードはこちら»

AWS クラウドが ビッグデータ分析にどのように役立つかに関する詳細は、AWS でのデータレイクと分析 の詳細ページをご参照ください。