Amazon Web Services ブログ
Amazon Transcribe Call Analytics で顧客との会話からインサイトを抽出する
この記事は、Extract Insights From Customer Conversations with Amazon Transcribe Call Analytics を翻訳したものです。
2017 年に発表された Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識サービス (ASR) です。2021 年 8 月 4 日に発表された Amazon Transcribe Call Analytics は、1 回の API コールで顧客との会話から貴重なインサイトを簡単に抽出できる新機能です。
潜在的な顧客または既存の顧客との対話は、顧客のニーズや期待について学ぶ機会です。例えば、カスタマーサービスチームにとって重要なのは、顧客が電話をかけてきた主な理由を把握し、通話中に顧客満足度を測定することです。同様に、営業担当者は顧客の関心や特定のセールストークへの反応を測定しようとします。
したがって、コンタクトセンタープロバイダーに関わらず、多くの顧客やパートナーがさまざまなアプリケーションに通話分析機能を追加したいと考えています。電話以外 (例えば、ウェブベースの音声・ビデオ通話) の分析が必要になることもよくあります。これまでは、AI サービスや専用の機械学習モデルをつなぎ合わせてやりくりするのが一般的でしたが、もっとシンプルなソリューションが求められています。
そこで Amazon Transcribe Call Analytics の構築に取り組み、Transcribe に新機能を追加し、AWS Contact Center Intelligence に重要な機能強化を加えました。すぐにでもお試しになりたい方は、AWS コンソールにアクセスしてください。さらに詳しく知りたい方は、このままお付き合いください。
Amazon Transcribe Call Analytics の紹介
Transcribe に基づいて Transcribe Call Analytics は、顧客との通話を対象として特別にトレーニングされた自然言語処理 (NLP) 機能を追加し、高精度な通話の文字起こしと実用的なインサイトを提供するように最適化されています。単純な API コールにより、デベロッパーは AI パイプラインを構築し、カスタム機械学習モデルをトレーニングしなくても、あらゆるアプリケーションに通話分析を簡単に追加でき、会話から顧客インサイトを抽出できます。
Transcribe Call Analytics の主な機能は次のとおりです。
- 21 言語でタイムスタンプ付き音声案内通話文字起こし。
- 問題の検出。話者の交代時に、顧客が電話をかけている理由を表す最短の単語列を拾い出します。設定やトレーニングなしでそのまま使用できます。
- 会話特性に基づく通話の分類:
- 特定の語句の照合
- 非通話時間の検出
- 中断の検出
- 顧客とエージェントのセンチメントを分析します。
- 以下のような通話特性:
- 顧客やエージェントの話す速さと声の大きさ
- 非通話時間の検出
- 中断の検出
- 文字起こししたテキストに対応する音声ファイルから機密データを削除。
たとえば、顧客がエージェントの話を遮って否定的なセンチメントを示し、「管理職と話したい」と言うような通話にフラグを付けるルールを作成できます。これらの通話は確かにうまくいかず、詳細に分析する価値があります。 数話の開始後 15 秒以内に事前設定された挨拶 (「ACME サポートへようこそ、ご用件をおうかがいします。」) を使用していない通話を探すことで、スクリプトのコンプライアンスを測定し、スーパーバイザーがエージェントのコーチング機会を特定することができます。もう 1 つの一般的なシナリオは、知っておく必要がある新たな傾向を把握するために、特定の製品やサービス (「ACME Turbo 2000 掃除機が正常に動作しない」) について言及するルールを作成することです。
最後に、Amazon Translate などの他の AI サービス、またはAmazon SageMaker で構築されたカスタム NLP モデルを使用して、文字起こししたテキストをさらに処理できます。
では、簡単なデモをお見せしましょう。
Amazon Transcribe Call Analytics によるインサイトの抽出
以下は、架空のサポート通話です。女性がクレジットカードとデビットカードを紛失したことを報告するために銀行に電話します。サウンドファイルはステレオ WAV ファイル (16 ビット、8 kHz) です。
Transcribe Call Analytics で分析するには、エージェントと顧客を各自のチャネルに記録する必要があります。エージェントチャネルがどれであるかの確認も必要です。通常のステレオファイルでは、左チャネルが第 1 チャネル (チャネル 0)、右チャネルが第 2 チャネル (チャネル 1) です。この通話の場合もそうです。
どちらがわからない場合は、汎用性の高い ffmpeg
オープンソースツールを使用すれば、各チャネルを個別の音声ファイルに簡単に抽出できます。
$ ffmpeg -i demo-call.wav -map_channel 0.0.0 channel0.wav -map_channel 0.0.1 channel1.wav
同じ手法で、動画ファイルなどの他のファイルタイプから音声チャネルを抽出し、ステレオ音声ファイルに再結合できます。詳細情報は ffmpeg
のドキュメントに記載されています。
エージェントがチャネル 1 であることが確実なので、 AWS CLI を使用して S3 バケットに音声ファイルをアップロードします。
$ aws s3 cp launch-call.wav s3://jsimon-transcribe-useast1/demo-call.wav --region us-east-1
Transcribe Call Analytics コンソールを開くと、通話カテゴリーテンプレートをご利用いただけます。
スーパーバイザーへのエスカレーション用に作成することにしました。次に、数回のクリックでwelcome-message
という名前のカスタム通話カテゴリーを作成し、エージェントが適切なご挨拶で通話を開始するかどうかを確認します。必要に応じて、定型句を追加して照合できます。「ええと」「あのぅ」などの間投詞 (通称「ケバ」) が挟まれる可能性を最小限に抑えるために、短い文にすることをお勧めします。
次に、Transcribe で利用できる一般的なモデルを使用して、通話分析ジョブを作成します。自動言語検出も可能です。
次に、S3 での音声ファイルの場所を定義し、チャネル 1 をエージェントチャネルとしてフラグ付けします。
文字起こししたテキストを自分のアカウント内の Transcribe で作成されたデフォルト S3 バケットにを保存することにしました。必要に応じて、独自のバケットもご使用いただけます。次に、十分なアクセス権限を持つ AWS Identity and Access Management (IAM) ロールを選択して、ジョブを起動します。
ジョブは 1 分ほどで完了します。コンソールには、文字起こししたテキストのプレビューと完全な JSON 形式のファイルのリンクが表示されます。
エージェントが通話開始後 15 秒間に適切なご挨拶を述べたので、通話は先ほど作成したカテゴリーでタグ付けされます。
文字起こしした JSON 形式のファイルをダウンロードすると、会話の各文に、単語ごとの音量に関するメタデータが付加されます。音量は 0~100 の範囲で測定され、100 は大音量です。1 文目は次のとおりです。
"BeginOffsetMillis":440,"EndOffsetMillis":4960,
"Sentiment":"NEUTRAL",
"ParticipantRole":"AGENT",
"LoudnessScores":[78.68,80.4,81.91,78.95,82.34],
"Content":"お電話ありがとうございます。△△銀行です。担当のアシュリーです。本日はどのようなご用件でしょうか?"
次の文を見ると、Transcribe Call Analytics で顧客の問題が自動的に検出されたことがわかります。対応するテキストは太字で表示されます。
"Content": "こんにちは、カードの解約をご希望とのことですね。あの、デビットカードとクレジットカードなんです。",
"IssuesDetected":
[
{
"UnredactedCharacterOffsets":
{
"Begin": 26,
"End": 40
}}. . .
文字起こししたテキストの終わりに、グローバル通話の統計 (継続時間、通話時間、分あたりの語数、一致したカテゴリー) が表示されます。Transcribe は、-5 (非常に否定的) から +5 (非常に肯定的) までで測定した全体的なセンチメント情報も教えてくれます。四半期に分けて内訳を把握できます。
"Sentiment":{"OverallSentiment":{"AGENT":2.6,"CUSTOMER":0.2},
"SentimentByPeriod":{"QUARTER":
{"AGENT":[
{"Score":1.9,"BeginOffsetMillis":0,"EndOffsetMillis":68457},
{"Score":-0.7,"BeginOffsetMillis":68457,"EndOffsetMillis":136915},
{"Score":5.0,"BeginOffsetMillis":136915,"EndOffsetMillis":205372},
{"Score":3.0,"BeginOffsetMillis":205372,"EndOffsetMillis":273830}],
"CUSTOMER":[
{"Score":-1.7,"BeginOffsetMillis":0,"EndOffsetMillis":68165},
{"Score":0.0,"BeginOffsetMillis":68165,"EndOffsetMillis":136330},
{"Score":0.0,"BeginOffsetMillis":136330,"EndOffsetMillis":204495},
{"Score":2.1,"BeginOffsetMillis":204495,"EndOffsetMillis":272660}]}}}
否定的なセンチメントで通話を開始した顧客が、まもなく中立的なセンチメントに移行し、通話を終える頃には肯定的なセンチメントになっていたことがわかります。これは、通話がうまく処理され、顧客の問題が解決されたことを示す良い兆候です。
文字起こししたテキストを Word 文書に変換してさらに可視化できるように、同僚の Andrew Kane が構築したすばらしいツールを Github で使用できるようにしてくれました。このツールで生成した報告書の例を次に示します。
AWS カスタマーサーパスとパートナーが Amazon Transcribe Call Analytics を使用
Talkdesk の上級副社長であり、製品技術、人工知能、オートメーション、人事管理のグローバル責任者であるBen Rigby によれば、「弊社のお客様は、コンタクトセンターで年間に何百万件ものカスタマーサービスを処理しており、良好な事業成果を確実に上げるうえで非常に重要なのが実用的な会話のインサイトを抽出することです。AWS Contact Center Intelligence パートナーとして、Amazon Transcribe で通話の文字起こし機能をさらに強化しました。Amazon Transcribe Call Analytics の発売により、音声分析および QM Assist 製品に AI 機能を追加できるようになりました。このような深い洞察により、カスタマーサービスの対応の速さと品質の向上を図るうえで必要なデータをエージェントやスーパーバイザーに提供し、従業員の生産性向上につながります。」
SuccessKPIの最高製品責任者である Praphul Kumar は次のように付け加えています。「Amazon Transcribe Call Analytics API により、機械学習ベースの機能を当社のプラットフォームに迅速かつ低コストで追加できます。この新しい API は、複数の AI サービスを統合し、分野ごとにカスタム機械学習モデルを開発する必要がなくなります。Transcribe Call Analytics では、センチメント、非通話時間、通話カテゴリーなどの会話のインサイトを提供し、エージェントのパフォーマンスを測定できます。そうすることで、通話による成果の向上、エージェント離職率の削減、エージェントのコーチング機会の発見、通話内容のコンプライアンス測定に役立ちます。AWS のサービスを SuccessKPIのエクスペリエンス分析プラットフォームに組み込むのは簡単でした。この貴重な機能が大企業や政府機関納入される日が来るのを楽しみにしています。」
開始方法
たった 1 回の API コールのみで顧客との会話から豊富なインサイトを抽出できるのです。現在 Amazon Transcribe Call Analytics をご利用いただけるリージョンは以下のとおりです。
- 米国西部 (オレゴン)、米国東部 (バージニア北部)、
- カナダ (中部)、
- 欧州 (ロンドン) 、欧州 (フランクフルト) 、
- アジアパシフィック (ムンバイ)、アジアパシフィック (シンガポール)、アジアパシフィック (ソウル)、アジアパシフィック (シドニー)、アジアパシフィック (東京)。
AWS コンソールでこの新機能をお試しのうえ、ご意見をお寄せください。いつも皆様からのフィードバックをお待ちしています。 通常の AWS Support の連絡先までお寄せいただくか、Amazon Transcribe の AWS フォーラムから送信していただけます。
最後に 1 つ、使いやすいオムニチャネルクラウドコンタクトセンターをお探しの場合は、Amazon Connect と機械学習を搭載した分析、Contact Lens をぜひご覧ください。