分析環境を Amazon SageMaker に統一化したことでノウハウや知見の共有が進み、
担当者間で共同作業ができるようになりました。
チーム全体で分析のレベルアップが実現し、メンバーのモチベーションも高まっています。
滝澤 俊哉 氏 株式会社ブックリスタ システム部シニア・エンジニア 兼 デジタルマーケティング企画部

提携電子書籍ストアの運営サポートをはじめ、電子書籍の取次事業などを展開する株式会社ブックリスタ。電子書籍コンテンツに関するさまざまな分析を行うデジタルマーケティング部門では、担当者ごとに属人化した分析環境やツールが課題になっていました。そこですべての環境を機械学習のマネージド型サービスである Amazon SageMaker で統合。データ加工、分析、モデル開発、レポート作成などが Amazon SageMaker 上で完結し、作業効率が飛躍的に向上しました。


 

電子書籍に関連するさまざまな事業を展開するブックリスタ。主力のストア事業では、提携電子書店にプラットフォームを提供し、コンテンツ企画、編成業務、ユーザーサポートなどストアに関わる運営業務を支援しています。ストアで販売する電子書籍コンテンツをより多くの人に的確に届けるためには、作品の特長、面白さ、ユーザーの読書傾向などを把握し、戦略的なアプローチを取ることが求められます。

そこで同社のデジタルマーケティング部門では、さまざまな分析を行っています。中でも電子書籍コンテンツを分類してタグ付けする作業は、重要な業務の 1 つです。出版社から大まかなカテゴリーは示されますが、実際にはコミックひとつとってもスポーツや恋愛などさまざまなジャンルがあり、それらジャンルの複数にまたがる作品もあります。そのうえ、男性向け、女性向け、少年向け、青年向けなど更に細分化が必要です。

そのため、同社はコンテンツが読みたい読者に届くよう、配信する際は出版社から提供された書誌情報などをもとに独自にタグ付けをしています。しかし同社が扱う電子書籍は 60 万冊以上あり、手作業には限界があります。そこで書誌情報やメタ情報から各種情報を抽出し、タグ付けを自動化するための分析を行っています。

これらの分析は 8 名で構成されるデジタルマーケティング部門のチームで実行していますが、分析に用いるツールは担当者に任されていました。「結果的に分析業務が、個人に依存する状態でした。Excel を使って分析する人もいれば、使い慣れた BI ツールを使う人、Jupyter Notebook を使って分析する人などさまざまです。ツールが違えば同じことを分析しても結果が異なることもあり、共同で作業ができません。ノウハウや知見も限定的になり再利用も困難でした。」と語るのは、システム部 シニア・エンジニア 兼 デジタルマーケティング企画部の滝澤俊哉氏です。そこで同社は、分析を加速する環境の構築に向けて、個別化していたツールの統合を検討しました。

 

2010 年の会社設立以来、クラウドサービスやマネージドサービスを積極的に採用し、IT インフラを AWS で構築してきた同社は、分析ツールについても Amazon SageMaker を選択しました。「以前からコンテンツデータの蓄積に Amazon Redshift を利用していたこともあり、親和性を考慮して Amazon SageMaker の検討をしていました。AWS 主催のハンズオンに参加するなどして価値を感じてはいたものの自分一人でチーム全体に波及することが難しく、また、そこに割く時間を作ることができませんでした。そんな中ナレッジコミュニケーション社から今回のご提案をいただきました。」と滝澤氏は語ります。

導入時は、2014 年から同社の AWS 環境の保守を支援してきたナレッジコミュニケーションに支援を依頼。2019 年 4 月にプロジェクトをキックオフし、要件定義やアーキテクチャの設計を経て 5 月末に第 1 回目のハンズオンを実施しました。ハンズオンはデジタルマーケティング部のメンバーほぼ全員が、自社の AWS 環境に Amazon SageMaker のノートブックインスタンスを立ち上げ、データを読み込んで学習し、モデルを構築して分析する一連のプロセスを半日間にわたって体験しました。滝澤氏は「実際のデータを活用した実践に近い形でのハンズオンだったので、知識ゼロからのスタートでも環境構築からデータ加工、分析、モデル開発までが自由にできることがわかり、実際のビジネスでも使える手応えを得ることができました。」と振り返ります。

ハンズオンのポイントは、実際に同社の情報を用いて分析が体験できるようにしたことにあります。ナレッジコミュニケーション 取締役副社長 COO の小泉裕二氏は「Amazon SageMaker を利用するハードルを下げるためにブックリスタ様の AWS 環境内に構築し、実データを使って分析に必要な一連の流れを確認していただきました。そのために安全性を考慮し、セキュアな環境を用意することに注意を払いました。」と語ります。

新しい分析環境は、Amazon SageMaker、Amazon Redshift、Amazon S3 で構成されています。ユーザーは Amazon SageMaker でノートブックインスタンスを作成し、Amazon Redshift または Amazon S3 からデータを取得して、学習、分析、モデル化を実行します。分析結果をビジュアル化するために別途 BI ツールを用意し、コンテンツに紐付く各種情報が社内の関連部署からも見られるようにしています。それによって、会社全体からフィードバックが寄せられ、分類の正確性が向上していくといいます。Amazon SageMaker の本格的な活用はこれからですが、ハンズオンで体感したことでさまざまな効果がもたらされることが確認できました。

1 つは分析者が個々に分析環境を用意する必要がなくなり、コスト面が最適化されたことです。既存の Jupyter Notebook のモデル開発ライブラリーの流用もできるため、初期コストの軽減につながるといいます。

2 つめは作業効率の向上です。従来は分析プロセスのデータ加工、分析、モデル開発、レポート作成の各工程で異なるツールを使うことが多く、大量のリソースを使う学習工程は別の環境で実施し、結果を元に戻すということもありました。導入後はすべて Amazon SageMaker 上で完結するため、工程間のつなぎが不要になりました。データの共有が容易になったことで、ある分析担当者が作成したノートブックのモデルを、別の分析担当者が自分のノートブック環境からアクセスして共同で作業することも可能になりました。

「私自身、今まで Jupyter Notebook で分析してきましたが、それまで蓄積したノウハウをチームで共有しやすくなったことを実感しています。メンバーも新たな切り口で分析しながら“こうしたらいい”という意見が言いやすくなりました。結果的にチーム全体で分析のレベルアップが実現し、メンバーのモチベーションも高まっています。」(滝澤氏)

diagram_booklista

今後は Amazon SageMaker の活用を本格化していくことに加え、機械学習や AI を用いた分析に向けて、新たなツールの活用にも関心を示しています。その 1 つが、開発者が個別のレコメンデーションを簡単に作成できる Amazon Personalize や、履歴データをもとに時系列予測する Amazon Forecast です。滝澤氏は「電子書籍業界でも機械学習や AI の波が押し寄せ、私たちも少ない人数で対応していかなければなりません。そのためにも積極的に AWS のマネージドツールを活用し、知識を蓄えていきます。AWS とナレッジコミュニケーションには今後も変わらぬ支援を期待しています。」と話します。

booklista_takizawa

滝澤 俊哉 氏


APN コンサルティングパートナー
株式会社ナレッジコミュニケーション

AWS の AI/ML サービスをお客様目線で利用いただく支援を行っているコンサルティングパートナーです。お客様自身の AI/ML 導入並びに運用を促進する「Amazon SageMaker 内製化ソリューショ ン」を提供しています。

Knowledge Communication Co.,Ltd_web
PDF 版のダウンロードはこちら»

AWS が提供する機械学習および AI サービスに関する詳細は、AWS の Machine Learning ページを御覧ください。