Amazon Redshift を利用することで、一般的な ANSI SQL でほぼ全ての集計を行うことができ、数十億行を超えるデータであっても、かんたんな集計であれば数秒程度で返ってくるので、ビッグデータとの相性が非常に良いです。
阿夛 浩孝 氏 株式会社 メタップス プロダクト開発部 システム基盤開発チーム マネージャー

株式会社メタップスは、2014 年からスマートフォンマーケティングに必要なユーザー行動分析から広告効果測定をワンステップで行える『metaps Analytics』を提供しています。世界中から集まるユーザーの行動データから市場に最適化した様々なビッグデータを活用した解析結果を可視化し、集客から収益化までのプロセスをサポートしています。

metaps_image

メタップス社では、『metaps Analytics』プロジェクトの立ち上げにあたって、世界各国からサービス単位で突発的に発生する高トラフィックに耐えうるインフラ基盤と、その環境の海外リージョンへの展開、ビッグデータ分析環境が優先課題となっていました。

メタップス社のシステム基盤開発チームのマネージャーである阿夛 氏は「2014 年からスタートしたこのプロジェクトの初期開発時は、エンジニアの人数も少なく、かなりタイトなスケジュールでリリースまでを求められており、こうした課題に対してより早く、柔軟に対応できる環境が必要でした。」と言います。

専門のインフラチームを持たないメタップス社では、全てのエンジニアが最速で新しい環境を構築できることが求められました。AWS の場合、AWS マネジメントコンソールから即座に新しい環境を構築できることが、まず同社の運用体制にマッチしました。また、「セキュリティ面での信頼、インフラ面の安定性、可用性を考えると、AWS 以外の選択肢はありませんでした。」(阿夛 氏)

ビッグデータを取り扱う上では、解析に採用すべきソリューションや、分析にかかるスピードも非常に重要となります。さらに、データの保管にかかるコストやデータの転送にかかる費用やオーバーヘッドも考慮する必要がありました。これらの課題についても AWS のプライベート接続により解消することができました。「ほぼすべてのサーバー間がプライベート接続として、転送料がかからない点も採用のポイントの一つとなりました。

こうした点から『metaps Analytics』での AWS の採用が決定し、インフラの構築は約 2 週間ほどで完了し、仕様が決まってから、約 3 ヶ月程でサービスリリースが完了しました。

メタップス社では、広告のビッグデータ分析基盤として Amazon Redshift を利用しています。また、期間指定で訪問者データを表示するための検索エンジンとして Amazon Elasticsearch Service を、Amazon RDS から集計に必要なテーブル同期を Amazon Redshift へ定期的に同期するために AWS Data Pipeline を利用している他、Amazon Redsfhitから集計を行った集約データの保存、参照には Amazon Aurora も利用しています。

jp_diagram_metaps_1024x628

メタップス社では、広告配信からデータの解析まで、2012 年から 4 年以上利用しています。

AWS を利用するまでは要件を満たすため、継続的に投入されるデータを短いスパンで集計を行う必要があり、その集計のデータ範囲も非常に広いことから、かなりの時間がかかっていました。「Amazon Redshift を利用することで、一般的な ANSI SQL でほぼ全ての集計を行うことができるため、数十億行を超えるデータであっても、かんたんな集計であれば数秒程度で返ってくるので、ビッグデータとの相性が非常に良いです。」(阿夛 氏)

また、「AWS を利用するようになってから、これまで専門のインフラチームが行っていたような作業内容を、AWS マネジメントコンソールから行うことができるため、環境構築にかかる人的コストも大きく軽減できました。」(阿夛 氏)

機能面でも、各マーケットで SSL に対しての優位性が上がってきている中、AWS Certificate Manager での無料、自動更新の SSL 発行が役立っています。

metaps_photo

- 株式会社 メタップス プロダクト開発部 システム基盤開発チーム マネージャー 阿夛 浩孝 氏

メタップス社では現在、リアルタイムのログ分析から、データの投入までのプロセスに、サードパーティーのライブラリを利用しています。東京リージョンで Amazon Kinesis Firehose がリリースされ、この部分の置き換えができれば、かなりの運用コストの削減ができると見込んでいます。

AWS クラウドがビッグデータ分析でどのように役立つかに関する詳細は、AWS でのビッグデータ分析の詳細ページをご参照ください。