Amazon Web Services ブログ

Bewgle が AWS を原動力にして、非構造化テキストをインサイトに変える

SAP.iO および Techstars の資金提供を受ける企業である Bewgleは、AWS のサービスを使用してユーザー側で生成されたテキストや音声ストリームからインサイトを浮上させます。同社はインサイトの生成により、美容器具や電子機器といったさまざまな製品において、顧客満足度やエンゲージメントの向上を目指すプロダクトマネージャーのサポートを行っています。  AWS の技術を原動力とする Bewgle の支援を受けて顧客の声に耳を傾けると、プロダクトマネージャーは製品の売り上げの増大が実現できるようになります。

平均的な人間が 1 分間に読める文字数は約 250 字にすぎません。そのため、1000 件のカスタマーレビューをまとめるには、8 時間あまりかかってしまいます。すると、こうしたレビューすべてに加え、フォーラム投稿やブログ投稿のようなその他のテキスト、そしてアンケート結果の逐語的記録や音声ストリームを分析することなど実行できるはずがありません。

AI、特に natural language processing (NLP) と呼ばれる機械学習 (ML) が優れているのはまさにこの分野です。Bewgle の中心的なソリューションは AWS 上ですべてが開発された AI プラットフォームで、数百万規模のコンテンツを分析し、キートピックおよびその背後に潜む感情を抽出します。Amazon Machine Learning および AWS テックスタック全体では、通常なら数年かかる作業をわずか数分で完了できます。

Bewgle のソリューションはまさに、幅広い AWS のサービスを活用しているのです。Bewgle のデータ処理パイプラインが依存する AWS Lambdaおよび Amazon DynamoDB は以下の ML タスクのコアを形成します。

  • 大規模な分析データを保存する。
  • データのクリーンアップする。
  • さまざまな処理機能をダイナミックに活用して分析を生成する。

チームは、システムのスケーリング、大まかに結合されたさまざまなワークフローを組織するために、革新的でサーバーレスな ML ワークフローを開発しました。チームはこれにより、さまざまなアプローチを評価、選択するにあたって驚異的な俊敏性および柔軟性を得て、スピーディーなイノベーションを推進することが可能になりました。

Bewgle のワークフローは通常、大規模かつオンデマンドのデータの収集、タグ付けを行うAmazon SageMaker Ground Truthからスタートします。チームは、Amazon SageMaker Ground Truth が提供するデータのタグ付けの高精度を称賛しています。Bewgle の共同創設者である Shantanu Shah 氏は、「Amazon SageMaker Ground Truth は Bewgle において効率性を実現するため、マニュアルのタグ付け作業者を探したり管理したりする必要がなくなります。価格も手頃です」と述べています。

データのタグ付けが完了すると、Bewgle チームは Amazon SageMaker に戻って、理由付けが開始します。  データ処理が得意の Jupyter Notebook インターフェイスを使用するため、すばやく簡単に複数のモデルの構築、テストできます。  Amazon SageMaker 内でチューニングする自動ハイパーパラメータは、Bewgle チームが膨大な労力をかけるはずだった作業を大幅に高速化、円滑化し、高い精度および信頼性の達成を可能にします。

次のステップであるモデルのデプロイでも Amazon SageMaker がそのソリューションとなります。  Amazon SageMaker によるデプロイが有益である理由は、Shah 氏の言葉によれば、「スケーラビリティおよび冗長性の管理が自動であるため、トラフィックバーストは問題にならない」ことにあります。   また、Shah 氏は「全体的に、Amazon SageMaker はモデルのビルド、チューニング、サービングすべてのステップでサポートし、Bewgle の労力を大幅に削減してくれます」と付け加えました。

このエンドツーエンドのワークフローを次のダイアグラムに示しました。

お客様がインサイトを利用できるようにするため、チームはAWS Elastic Beanstalkを使用する API を構築しました。この API により、お客様はあらゆる形式のデータを消費できます。また、API の最上部に構築された UI レイヤーにより、お客様がデータをダイジェストおよびダッシュボードとして閲覧することも可能です。  この実装によって、大規模なユーザーインサイトに耳を傾けることが簡単になります。  R&D チームで Bewgle を利用するユーザーは新製品のデザインをよりスマートにできます。製品デザインチームなら見落としがちな多くの要素について検討できます。ビジネス開発チームなら新機能決定の際に競合他社のデータの分析および比較に利用できます。

顧客サポートチームも、Bewgle におけるキーユーザーグループの 1 つです。顧客サポートにおける従来のアプローチでは、すでに持っている構造化データ (メールテンプレートなど) に関連するクエリへの応答が大部分を占めていたか、または厳密にそれに集中していました。  逐語的記録 (ホテル客によるコメントなど) は非構造化データであるため、顧客サポートクエリに応答できません。しかし、Bewgle は引き続きカスタマーサービスを強化していくうえで、この非構造化テキストデータを構造化データに変換することの重要性を確信しています。Bewgle の NLP アルゴリズムはデータが増えるにつれて継続して学習し、そのアウトプットはカスタマーサービスチームが使用可能な構造化データになります。たとえば、容器が開かず中身を出せなかった製品について、顧客がフィードバックフォームに書き込みしたとします。カスタマーサービスチームはそのインサイトから、ある特定のバッチで接着剤が固まったことが容器が開かなくなった原因とわかります。この例のように、企業は顧客出荷の準備完了パイルから当該バッチを除外して、不満を持つ顧客を増やすこと (また、それにより結果として収益を失う可能性) を回避できます。

チーム構成は、情報オーバーロード問題の解決を目的に Bewgle を創設した元 Google 社員です。  Bewgle クルーは、AWS AI および ML サービスによって「頭痛のネタ」が減り、もっとインパクトのあるワークフローが実現できることがわかりました。AWS テックスタックの使いやすさ、ドキュメンテーション、幅広い人気は非常に魅力的で、Bewgle がその主要な AI/ML プラットフォームとして AWS を選択する理由となっています。

Shah 氏は、「Amazon SageMaker で、驚異的な柔軟性を得ました。これで、結果としてモデルを高速反復できるようになり、それが弊社の強みを直接強化しています」と指摘します。

非構造化データの分析、NLP、AI 技術の意識が高まるになかで、Bewgle は昨年以来同社のビジネスの急速な成長を実感しています。チームは将来に向け、その技術を別の業界に向けてさらにスケールアップし、地理的拡大も目指すことを考えています。


著者について

Marisa Messina は、AWS AI マーケティングチームに所属しています。彼女は、最も革新的な AWS を使用している顧客を特定し、示唆に富んだストーリーを紹介することを仕事にしています。AWS に入社する前は、Microsoft で消費者向けハードウェア、次に大学向けクラウド製品を担当していました。仕事以外では、太平洋岸北西部のハイキングコースを探索したり、レシピなしで料理をしたり、雨の中で踊ったりして楽しんでいます。