Amazon Web Services ブログ
Amazon言語系AIサービスによるコンタクトセンターの通話後分析
2023 年 6 月 (v0.6.0) — このリリースでは、完了した通話の概要を提供する生成系 AI によるトランスクリプト(文字起こし)要約が導入されました。Amazon Sagemaker で実行される組み込みの要約モデルや、Anthropic の Claude 大規模言語モデル (LLM) API (Amazon Bedrock に搭載予定) を使用するか、他のカスタム言語モデルや API を試してみてください。このリリースでは、UI も更新されています。「新機能」を参照してください。
コンタクトセンターはビジネスをコミュニティにつなげ、顧客が製品を注文したり、電話をかけてきた人がサポートをリクエストしたり、クライアントが面会の予約をしたりできるようにします。発信者との各会話は、その発信者のニーズと、通話中にそれらのニーズがどの程度うまく対処されたかを知る機会です。これらの会話から、スクリプトコンプライアンスを管理し、顧客を満足させる新しい機会を見つけるのに役立つ洞察を引き出すことができます。たとえば、報告されたギャップに対処するようにサービスを拡大したり、報告された問題領域の品質を向上させたり、コンタクトセンターのエージェントが提供するカスタマーエクスペリエンスを向上させたりすることができます。
Contact Lens for Amazon Connect では、このようなインサイトが得られる豊富な分析機能を備えた通話の文字起こしが可能ですが、現在 Amazon Connect を使用していない場合は、既存のコンタクトセンターの通話録音と連携するソリューションが必要です。
Amazon Transcribe Call Analytics や Amazon Comprehend などの Amazon 機械学習 (ML) サービスには、コンタクトセンターの音声録音からインサイトを大規模に転記したり抽出したりできる機能豊富な API が用意されています。これらのサービスを使用して独自のカスタム通話分析ソリューションを構築することもできますが、それには時間とリソースが必要です。この投稿では、通話後の分析のためのサンプルソリューションについて説明します。
ソリューションの概要
サンプルソリューションである Post Call Analytics(PCA)は、既存のコンタクトセンターからの通話録音を処理できるエンドツーエンドのソリューションを提供することに伴う面倒な作業のほとんどを行います。PCAは、新しいトレンドを見極め、エージェントのコーチング機会を特定し、電話に対する一般的な感情を評価するための実用的な洞察を提供します。
通話録音を提供していただくと、PCA は Amazon Transcribe Call Analytics やその他の AWS サービスを使用して自動的に処理し、顧客やエージェントのセンチメント、電話をかけた理由、話し合ったエンティティ、会話の特徴(非通話時間、中断、音量、通話速度など)などの貴重な情報を抽出します。Amazon Transcribe Call Analytics は、何千時間もの会話を使ってトレーニングされたビルトインの ML モデルを使用して問題を検出します。自動通話分類機能を使用すると、キーワードやフレーズ、センチメント、非通話時間に基づいて会話にタグを付けることもできます。また、名前、住所、クレジットカード番号、社会保障番号などの機密顧客データを記録ファイルと音声ファイルの両方から任意でマスキングすることができます。
(New!) PCA (v0.4.0 以降) では、新しい Amazon Transcribe Call Analytics サービスからの通話後の出力ファイルを直接処理することもできます。通話が終了したら、Amazon Transcribe Call Analytics ストリーミングセッションからの通話後の出力ファイル(JSON トランスクリプト、オーディオ録音)を提供してください。PCA は、オーディオ録音を再度書き起こすことなく、それらを自動的に処理します。両方の長所を活かすことができます!付属のライブ通話分析とエージェントアシスト (LCA) の最新バージョン (v0.6.0) は Amazon Transcribe Real-time Call Analytics をサポートしており、PCA との統合も簡単です。以下の「ライブ通話分析とエージェントアシスト:関連ソリューション」セクションを参照してください。
PCAのWebユーザーインターフェイスには、次のスクリーンショットに示すように、すべての通話を表示するホームページがあります。
レコードを選択すると、音声特性など、通話の詳細を確認できます。
下にスクロールすると、その他の通話情報や注釈付きの通話の詳細を確認することもできます。
日付、エンティティ、またはセンチメント特性に基づいて通話を検索できます。
通話の文字起こしを検索することもできます。
最後に、ビジネスインテリジェンス (BI) ツールから詳細な通話分析データをクエリできます。
PCA は現在、以下の機能をサポートしています。
- トランスクリプション(文字起こし)
- Amazon Transcribe カスタム語彙に対応したターンバイターンのバッチトランスクリプションにより、ドメイン固有の用語の正確性を実現
- トランスクリプトやオーディオファイルからの個人識別情報(PII)の編集、カスタム単語やフレーズのマスキングのための語彙フィルタリング
- 複数の言語と自動言語検出
- 標準オーディオファイル形式
- チャネル識別または話者ダイアライゼーションを使用した発信者およびエージェントのスピーカーラベル
- 分析
- 発信者とエージェントのセンチメントの詳細と傾向
- 発信者とエージェントの両方の通話時間と非通話時間
- キーワードやフレーズの有無、センチメント、非通話時間に基づいて設定可能な Amazon Transcribe Call Analytics カテゴリ
- Amazon Transcribe Call Analytics に組み込まれた通話要約 (ML) モデルを使用して、発信者の主な問題、アクションアイテム、結果を検出
- Amazon Comprehend の標準またはカスタムエンティティ検出モデル、または設定可能な単純な文字列マッチングを使用して、呼び出しで参照されるエンティティを検出
- 発信者とエージェントが互いに割り込み合ったことを検出
- スピーカーの音量
- 生成系 AI トランスクリプトの要約
- (New!) 完了した各通話のトランスクリプトを生成系 AI を用いて要約
- 検索
- 時間範囲、センチメント、エンティティなどの通話属性で検索
- 文字起こしを検索する
- Amazon QuickSight の分析パイプラインとダッシュボード
- オプションで、Amazon QuickSight による通話後分析 (PCA) ソリューション用の高度なレポートと分析をデプロイ可能
- その他
- 通話GUID、エージェント名、通話日時などのオーディオファイル名からメタデータを検出
- さまざまな通話量に対応できるよう自動的にスケーリング
- 新しい記録が到着したときに処理する容量を維持しながら、古い記録の大規模なアーカイブを一括読み込み
- PCA をすぐに試せるサンプル録画
- 単一の AWS CloudFormation テンプレートを使用して簡単にインストール可能
これはほんの始まりに過ぎません!皆様からのフィードバックをもとに、今後さらに多くのエキサイティングな機能を追加していく予定です。
CloudFormationスタックをデプロイする
まず、AWS CloudFormation を使用してサンプル記録をロードした状態でソリューションをデプロイし、PCA 体験を始めましょう。
- 次の Launch Stack ボタンを使用して、us-east-1 (バージニア北部) の AWS リージョンに PCA ソリューションをデプロイします。
ソースコードは GitHub リポジトリで入手できます。README の指示に従って、Amazon Transcribe がサポートするその他のリージョンに PCA をデプロイしてください。 - Stack name には、デフォルト値の
PostCallAnalytics
を使用してください。 - AdminUsername には、デフォルト値の admin を使用してください。
- AdminEmail には、有効なメールアドレスを使用してください。仮パスワードは、導入時にこのアドレスにEメールで送信されます。
- loadSampleAudioFilesの値を
true
に変更します。 - EnableTranscriptKendraSearch の値を
Yes, create new Kendra Index (Developer Edition)
に変更します。以前に Amazon Kendra 無料利用枠を使用したことがある場合は、このインデックスに 1 時間あたりのコストが発生します (コストの詳細については、この記事の後半で説明します)。Amazon Kendra のトランスクリプト検索はオプション機能なので、必要ない、またはコストが気になる場合は、デフォルト値の No を使用してください。 - CallSummarization では、
SAGEMAKER
を選択してビルトインモデル (約 1000 語に制限) をデプロイします。API キーを持つ Anthropic アカウントをお持ちの場合はANTHROPIC
を、その他のカスタム LLM または API を使用する場合はLAMBDA
を選択します。詳細については、Transcript Summarization を参照してください。 - EnablePcaDashboards の値を
yes
に変更して、オプションの分析パイプラインと Amazon QuickSight 分析とダッシュボードをインストールします。- 注:デプロイする前に、アカウントで Amazon Quicksight を有効にする必要があります。
- 別のブラウザタブで、AWS コンソールから QuickSight サービスに移動します。
- Sign up for QuickSight を選択します。
- エディションを選択します。
- アカウント名と通知メールアドレスを入力します。
- 注:デプロイする前に、アカウントで Amazon Quicksight を有効にする必要があります。
- 他のすべてのパラメータには、デフォルト値を使用してください。
カスタム語彙を適用して精度を向上させたり、エンティティ検出をカスタマイズしたりするなど、後で設定をカスタマイズする場合は、スタックを更新してこれらのパラメータを設定できます。 - 2 つの確認ボックスを選択し、Create stack を選択します。
メインの CloudFormation スタックは、ネストされたスタックを使用して AWS アカウントに以下のリソースを作成します。
- ビルドアーティファクトと通話録音を格納する Amazon Simple Storage Service (Amazon S3) バケット
- 設定を保存するための AWS Systems Manager Parameter Store 設定
- 録音ファイルの処理をオーケストレーションするための AWS Step Functions ワークフロー
- 音声ファイルの処理、およびターンバイターンの文字起こしと分析を行う AWS Lambda 関数
- 通話メタデータを保存するための Amazon DynamoDB テーブル
- 通話記録の概要を生成する Amazon SageMaker エンドポイント (選択した場合)。
- S3 バケット、Amazon CloudFront ディストリビューション、Amazon Cognito ユーザープールを含むウェブサイトコンポーネント
- AWS Identity and Access Management (IAM) のロールとポリシー (最小権限のベストプラクティスを使用)、Amazon Simple Queue Service (Amazon SQS) メッセージキュー、Amazon CloudWatch ロググループなど、その他のサポートリソース。
- オプションで、Amazon Kendra インデックスと AWS Amplify 検索アプリケーションを使用すれば、インテリジェントな通話履歴検索が可能です。
スタックのデプロイには約 20 分かかります。すべてがデプロイされると、メインスタックのステータスは CREATE_COMPLETE と表示されます。
パスワードの設定
スタックをデプロイしたら、PCA Web ユーザーインターフェイスを開き、パスワードを設定する必要があります。
- AWS CloudFormation コンソールで、メインスタックの
PostCallAnalytics
を選択し、Outputs タブを選択します。 - ウェブブラウザを開いて、出力に
WebAppURL
と表示されている URL にアクセスします。ログインページにリダイレクトされます。
- 指定した E メールアドレス宛に届いた “Welcome to the Amazon Transcribe Post Call Analytics (PCA) Solution!” という件名の E メールを開きます。このメールには、(ユーザー管理者として)ログインして独自のパスワードを作成するために使用できる生成された一時パスワードが含まれています。
- 新しいパスワードを設定します。
新しいパスワードは 8 文字以上で、大文字、小文字、数字、特殊文字を含む必要があります。
これで PCA にログインできました。loadSampleAudioFiles
を true に設定したので、PCA デプロイメントには 3 つのサンプル通話がプリロードされ、確認できるようになりました。
オプション:トランスクリプト検索 Web UI を開いて、パスワードを再設定する
以下の追加手順に従って、付属のトランスクリプト検索 Web アプリにログインします。このウェブアプリは、スタックの起動時に EnableTranscriptKendraSearch
を設定した場合にのみデプロイされます。
- AWS CloudFormation コンソールで、メインスタックの
PostCallAnalytics
を選択し、Outputs タブを選択します。 - ウェブブラウザを開いて、出力に
TranscriptionMediaSearchFinderURL
として表示されている URL を開きます。
ログインページにリダイレクトされます
- 指定した E メールアドレス宛に届いた “Welcome to Finder Web App.” という件名の E メールを開きます。このメールには、(ユーザー管理者として)ログインするために使用できる生成された一時パスワードが含まれています。
- PCA Web アプリケーションの場合と同じように、独自のパスワードを作成します。
PCA Web アプリケーションと同様に、新しいパスワードの長さは8文字以上で、大文字と小文字、数字と特殊文字が含まれている必要があります。
これで、トランスクリプト検索 Web アプリケーションにログインできました。サンプルオーディオファイルはすでにインデックス化されており、検索できる状態になっています。
オプション:Amazon QuickSight ダッシュボードを有効にするための追加のデプロイ手順
以下の追加ステップに従って Amazon QuickSight ダッシュボードを有効にします。このダッシュボードは、スタックの起動時に EnablePcaDashboards
を設定した場合にのみデプロイされます。
- QuickSight コンソールで、ユーザーアイコン (右上) を選択してメニューを開き、QuickSight を管理 を選択します。
- 管理ページで セキュリティとアクセス権限 を選択し、デプロイされたスタックの出力タブで参照されている Amazon S3
OutputBucket
へのアクセスを追加します。 - 管理ページで アセットの管理を選択し、ダッシュボード を選択します。
- -PCA-Dashboard を選択し、共有 を選択します。QuickSight ユーザーまたはグループを入力し、再度 Share を選択します。
- オプションで、ダッシュボードをさらにカスタマイズするには、analyses のアセットタイプで -PCA-Analysis を共有し、データセット で -PCA-* を共有します。QuickSight ユーザーまたはグループを入力し、再度 Share を選択します。
PCA の高度な分析とダッシュボードソリューションの詳細については、関連ブログ記事「Amazon QuickSight によるコール後分析 (PCA) ソリューションの高度なレポートと分析(英語)」を参照してください。
通話分析機能を見る
これで PCA が正常にインストールされたので、通話分析機能を試す準備ができました。
ホームページ
ホームページを調べるには、メインスタックの出力に WebAppURL
と表示されている URL を使用して PCA Web UI を開きます (この URL をブックマークしておくと便利です)。
ホームページにはすでに 6 件の通話が一覧表示されており、時間の降順(最新のものが最初)にソートされています。これらはサンプルオーディオファイルです。
通話には以下の重要な情報があります。
- Job Name – 録音されたオーディオファイル名から割り当てられ、この通話の固有のジョブ名として機能します
- Timestamp – 可能な場合はオーディオファイル名から解析されます。それ以外の場合は、録音がPCAによって処理される時間が割り当てられます
- Customer Sentiment and Customer Sentiment Trend — 全体的な発信者のセンチメントと、発信者が通話開始時よりも終了時の方が好意的だったかどうかを示します
- Language Code — 指定された言語、または自動的に検出された通話の主要言語を表示します
通話詳細
最近受信した通話を選択して、通話詳細ページを開いて調べてください。通話情報と、センチメント、通話時間、中断、音量などの分析を確認できます。
下にスクロールすると、以下の詳細が表示されます。
- エンティティタイプ別にグループ化されたエンティティ。エンティティは Amazon Comprehend とサンプルエンティティ認識文字列マップによって検出されます。
- Amazon Transcribe 通話分析によって検出されたカテゴリ。デフォルトでは、カテゴリはありません。詳細については、通話後分析 を参照してください。
- GenAI Transcript Summary タブには、通話の簡単な概要が表示されます (有効な場合)。詳細については、生成系 AI による通話の要約を参照してください。
- Call Analytics Summary タブには、問題、アクションアイテム、結果など、エージェントとカスタマーの通話における重要な要素の簡潔な概要が表示されます。詳細については、「Amazon Transcribe による通話後の要約(2023/9/7現在 日本語非対応)」を参照してください。
さらにスクロールすると、話者、タイムマーカー、センチメント、中断、問題、エンティティなどの注釈を含む、通話のターンごとの文字起こしが表示されます。
組み込みのメディアプレーヤーを使用して、会話のどの時点からでも通話音声を再生できます。トランスクリプトのタイムマーカーアノテーションを選択するか、プレーヤーのタイムコントロールを使用して位置を設定します。ページを下にスクロールしても、オーディオプレーヤーは表示されたままになります。
PII はトランスクリプトとオーディオの両方から編集されます。編集は CloudFormation スタックパラメーターを使用して有効化されます。
通話属性に基づく検索
PCA の組み込み検索を試すには、画面上部の Search を選択します。顧客のセンチメントが平均的にネガティブな通話を検索するためには、Sentiment において、Average、Customer、Negative を選択します。
Clear を選択して別のフィルターを試してください。Entity にHyundai
と入力し、Search を選択します。検索結果から通話を選択し、トランスクリプトから顧客が実際にヒュンダイについて電話をかけていたことを確認します。
通話トランスクリプトを検索する
トランスクリプト検索は、Amazon Kendra が提供する試験的なオプションのアドオン機能です。
メインスタックの出力に TranscriptionMediaSearchFinderURL
として表示されている URL を使用して、トランスクリプト検索 Web UI を開きます。最近の電話を検索するには、customer hit the wall
という検索クエリを入力します。
結果には、関連する通話からのトランスクリプションの抜粋が表示されます。内蔵オーディオプレーヤーを使用して、通話録音の関連セクションを再生します。
Filter search results を展開すると、追加のフィルターを使用して検索結果を絞り込むことができます。Open Call Analytics を選択して、この通話の PCA 通話詳細ページを開きます。
SQL を使用したクエリ通話分析
Amazon Athena SQL クエリを使用して、PCA 通話分析データを Amazon QuickSight などのレポートツールまたは BI ツールに統合できます。試してみるには、Athena クエリエディタを開きます。Database には pca を選択します。
parsedresults
テーブルの解析結果を確認してください。この表には、ネスト構造を使用して、各通話のターンバイターンの文字起こしと分析がすべて含まれています。
また、レポートや分析アプリケーションに簡単に統合できるフラット化された結果セットを確認することもできます。クエリエディターを使用してデータをプレビューします。
処理フローの概要
PCAは通話録音をどのように書き起こし、分析したのでしょうか? では、その仕組みを簡単に見てみましょう。
次の図は、主要なデータ処理コンポーネントと、それらがどのように組み合わされているかを大まかに示しています。
通話録音オーディオファイルは S3 バケットとフォルダーにアップロードされ、メインスタック出力ではそれぞれ InputBucket
と InputBucketPrefix
として識別されます。PCA をデプロイしたときに loadSampleAudioFiles
パラメーターを true に設定したため、サンプル通話録音は自動的にアップロードされます。
各記録ファイルが Input バケットに追加されると、S3 イベント通知が Lambda 関数をトリガーし、Step Functions でワークフローを開始してファイルを処理します。ワークフローは、Amazon Transcribe バッチジョブを開始し、エンティティ検出と通話分析結果の追加準備を行うことで結果を処理するステップを調整します。処理された結果は JSON ファイルとして別の S3 バケットとフォルダに保存され、メインスタックの出力では OutputBucket
と OutputBucketPrefix
として識別されます。
Step Functions ワークフローが出力バケットに各 JSON 結果ファイルを作成すると、S3 イベント通知が Lambda 関数をトリガーし、選択した呼び出しメタデータを DynamoDB テーブルへロードします。
PCA UI ウェブアプリは DynamoDB テーブルをクエリして、処理された呼び出しのリストを取得してホームページに表示します。通話詳細ページには、選択した通話の JSON 結果ファイルから追加の詳細な文字起こしと分析が読み込まれます。
Amazon S3 ライフサイクルポリシーは、デプロイパラメータ RetentionDays
で定義された設定可能な保存期間が経過すると、Input バケットと Output バケットの両方から記録と JSON ファイルを削除します。S3 イベント通知と Lambda 関数は、ファイルの作成時と削除時の両方で DynamoDB テーブルとの同期を維持します。
EnableTranscriptKendraSearch
パラメータが true
の場合、Step Functions ワークフローはタイムマーカーとメタデータ属性もトランスクリプションに追加し、Amazon Kendra インデックスに読み込まれます。トランスクリプション検索ウェブアプリケーションを使用して、通話のトランスクリプションを検索します。この仕組みの詳細については、「Amazon Transcribe と Amazon Kendra を使って、音声ファイルや動画ファイルを検索可能にする」を参照してください。
モニタリングとトラブルシューティング
AWS CloudFormation は、スタックの Events タブでデプロイの失敗と原因を報告します。一般的なデプロイの問題については、「CloudFormation のトラブルシューティング」を参照してください。
PCA は CloudWatch を使用して各コンポーネントのランタイムモニタリングとログを提供します。
- Step Functions ワークフロー — Step Functions コンソールで、ワークフロー
PostCallAnalyticsWorkflow
を開きます。Executions タブには、各ワークフロー実行のステータスが表示されます。任意の実行を選択すると詳細が表示されます。Execution event history から CloudWatch Logs を選択し、ワークフローによって呼び出された Lambda 関数のログを調べます。 - PCA サーバーと UI Lambda 関数 — Lambda コンソールで、
PostCallAnalytics
でフィルタリングすると、PCA 関連のすべての Lambda 関数が表示されます。関数を選択し、Monitor タブを選択すると、関数メトリックが表示されます。View CloudWatch Logs を選択して、関数ログを調べます。
コスト評価
PCA が使用する主なサービスの料金情報については、以下を参照してください。
- Amazon CloudFront の料金
- Amazon CloudWatch の料金
- Amazon Cognito の料金
- Amazon Comprehend の料金
- Amazon DynamoDB の料金
- Amazon API Gateway の料金
- Amazon Kendra の料金 (オプションの文字起こし検索機能用)
- AWS Lambda の料金
- Amazon Transcribe の料金
- Amazon S3 の料金
- AWS Step Functions の料金
- Amazon SageMaker サーバーレス推論 の料金
トランスクリプション検索を有効にすると、Amazon Kendra インデックスには 1 時間あたりのコストがかかります。開発者版は 1 時間あたり 1.125 USD (最初の 750 時間は無料)、エンタープライズ版は 1 時間あたり 1.40 USD (本番環境のワークロードに推奨) です。
Amazon SageMaker を使用してトランスクリプト要約を有効にすると、要約 SageMaker エンドポイントの初期インスタンス数に入力した値に応じて、SageMaker エンドポイントに追加料金が発生します (デフォルトはプロビジョニングされた 1 ノード ml.m5.xlarge エンドポイント)。「0」を入力して SageMaker サーバーレス推論を選択した場合は、使用量に対してのみ課金されます。関連する費用と無料利用枠の利用資格に関する情報については、Amazon SageMaker の料金表をご覧ください。代わりに ANTHROPIC
または LAMBDA
オプションを使用して要約することを選択した場合、LLM 関連の個別の料金はすべてお客様の負担となります。
その他の PCA 費用はすべて使用量に基づいて発生し、無料利用枠の対象となります。無料利用枠を使い切ると、5 分間の通話録音の使用コストは合計で約 0.15 USD になります。
PCA コストを自分で調べるには、AWS Cost Explorer を使用するか、AWS Billing Dashboardの Bill Details を選択して、サービス別の今月の支出を確認してください。
コンタクトセンターとの統合
通話レコーディングを有効にするようにコンタクトセンターを設定できます。可能であれば、2 つのチャネル(ステレオ)の録音を設定し、一方のチャネル(たとえば、チャネル 0)に顧客の音声、もう一方のチャネル(チャネル 1)にエージェントの音声を設定します。
AWS コマンドラインインターフェイス (AWS CLI) または SDK を使用して、コンタクトセンターのレコーディングファイルを PCA 入力バケットフォルダにコピーします。このフォルダは、メインスタック出力で InputBucket
と InputBucketPrefix
として識別されます。または、通話記録をすでに Amazon S3 に保存している場合は、デプロイパラメータ InputBucketName
と InputBucketRawAudio
を使用して、既存の S3 バケットとプレフィックスを使用するように PCA を設定します。これにより、ファイルを再度コピーする必要がなくなります。
(New!)また、コンタクトセンターからのストリーミングオーディオのリアルタイム分析には、最新バージョン(v0.6.0)のライブ通話分析とエージェントアシスト(LCA)を使用し、LCAをPCAと統合して両方の長所を活用することもできます。以下の「コンタクトセンターのライブ通話分析とエージェントアシスト:関連ソリューション」セクションを参照してください。
デプロイメントをカスタマイズする
スタックを作成または更新するときは、次の CloudFormation テンプレートパラメータを使用して PCA デプロイをカスタマイズします。
- オプションの (実験的な) 文字起こし検索機能を有効または無効にするには、
EnableTranscriptKendraSearch
を使用してください。 - 既存の S3 バケットを着信通話の録音に使用するには、
InputBucket
とInputBucketPrefix
を使用してください。 - 自動プロビジョニングされた S3 入出力バケットを使用する際の録音および通話分析データの自動削除を設定するには、
RetentionDays
を使用します。 - 録音ファイル名から通話タイムスタンプ、エージェント名、または通話識別子 (GUID) を検出するには、
FilenameDatetimeRegex
、FilenameDatetimeFieldMap
、FilenameGUIDRegex
、およびFilenameAgentRegex
を使用します。 - デフォルトの Amazon Transcribe Call Analytics API の代わりに標準の Amazon Transcribe API を使用するには、
TranscribeApiMode
を使用してください。Call Analytics API と互換性のないオーディオ録音(モノラルチャンネル録音など)は、PCA が自動的に標準 API を使用します。標準 API を使用する場合、一部の通話分析、問題検出、スピーカーの音量などの指標は利用できません。 - サポートされているオーディオ言語のリストを設定するには、
TranscribeLanguages
を使用してください。 - 不要な単語をマスクするには、
VocabFilterMode
を使用して、VocabFilterName
を Amazon Transcribe ですでに作成しているカスタム語彙フィルタの名前に設定します。詳細については、語彙フィルタリングを参照してください。 - 専門用語やドメイン固有の頭字語や専門用語の文字起こしの精度を向上させるには、
VocabularyName
を Amazon Transcribe ですでに作成したカスタム語彙の名前に設定するか (「カスタム語彙」を参照)、CustomLangModelName
を Amazon Transcribe ですでに作成しているカスタム言語モデルの名前に設定します (「カスタム言語モデル」を参照)。 - デフォルトでシングルチャンネルオーディオを使用するように PCA を設定し、チャンネル識別ではなくスピーカーダイアライゼーションを使用してスピーカーを識別するようにPCAを構成するには、
SpeakerSeparationType
とMaxSpeakers
を使用します。デフォルトでは、Amazon Transcribe Call Analytics API を使用してステレオファイルによるチャンネル識別を行い、最も豊富な分析と最も正確なスピーカーラベルを生成します。 - 文字起こしや音声から PII を編集するには、
CallRedactionTranscript
またはCallRedactionAudio
を true に設定します。詳細については、「リダクション(2023年9月7日現在 日本語非対応)」を参照してください。 - Amazon Comprehend を使用してエンティティ検出をカスタマイズしたり、エンティティを定義する独自の CSV ファイルを提供したりするには、Entity detection パラメータを使用します。
PCA の設定オプションと操作の詳細については、GitHub の README を参照してください。
PCA はオープンソースプロジェクトです。PCA GitHub リポジトリをフォークしてコードを拡張し、プルリクエストを送信していただければ、改善点を組み込んで共有できます。
既存の PCA スタックの更新
既存の PCA スタックを最新リリースに簡単に更新できます。「既存のスタックの更新」を参照してください。
クリーンアップ
このソリューションの実験が終了したら、AWS CloudFormation コンソールを開き、デプロイした PostCallAnalytics
スタックを削除してリソースをクリーンアップします。これにより、ソリューションをデプロイして作成したリソースが削除されます。データが削除されないように、オーディオ録音と分析を含む S3 バケット、および CloudWatch ロググループは、スタックが削除された後も保持されます。
コンタクトセンターのライブ通話分析とエージェントアシスト:関連ソリューション
関連ソリューションであるライブ通話分析とエージェントアシスト (LCA) は、Amazon Transcribe リアルタイム API を使用してリアルタイムの文字起こしと分析機能を提供します。通話終了後に録音された音声を書き起こして分析する PCA とは異なり、LCA は通話中に文字起こしと分析を行い、スーパーバイザーやエージェントにリアルタイムで最新情報を提供します。新しい Amazon Transcribe リアルタイム通話分析サービスは、通話が終了してからわずか数分後に、ストリーミングセッションからの通話後の分析出力を提供します。LCA(v0.6.0以降)では、この通話後の分析データをPCAに送信して、音声をもう一度文字起こしすることなく、完了した通話の分析を視覚化できるようになりました。LCA(v0.6.0以降)をPCA(v0.4.0以降)と統合するように設定し、2つのソリューションを一緒に使用して両方の利点を最大限に活用します。詳細については、「Amazon言語系AIサービスによるコンタクトセンターのライブ通話分析とエージェントアシスト」を参照してください。
まとめ
Post Call Analyticsソリューションは、スケーラブルで費用対効果の高いアプローチを提供し、通話分析に発信者のエクスペリエンスを向上させるのに役立つ機能を提供します。Amazon Transcribe Call Analytics や Amazon Comprehend などの Amazon ML サービスを使用して、顧客との会話を書き起こし、そこから豊富なインサイトを抽出します。
サンプル PCA アプリケーションはオープンソースとして提供されています。独自のソリューションの出発点として使用してください。また、GitHub のプルリクエストを通じてバックフィックスや機能を提供することで、改善に役立ててください。専門家のサポートについては、AWS プロフェッショナルサービスやその他の AWS パートナーがお手伝いします。
フィードバックは、PCA GitHub リポジトリの issue フォーラムをご利用ください。
執筆者について
Dr. Andrew Kane ロンドンを拠点とする AWS プリンシパル WW テックリード (AI 言語サービス) です。彼は AWS Language and Vision AI サービスに重点を置いており、お客様が複数の AI サービスを単一のユースケース主導型ソリューションに構築できるよう支援しています。2015 年の初めに AWS に入社する前、Andrew は 20 年間、信号処理、ファイナンス決済システム、武器追跡、編集および出版システムの分野で働いていました。彼は熱心な空手愛好家(ブラックベルトからたった一帯だけ)であり、自動醸造ハードウェアやその他の IoT センサーを使用する熱心な自家醸造家でもあります。
Bob Strahan AWS Language AI Servicesチームのプリンシパルソリューションアーキテクトです。
Connor Kirkpatrick コナー・カークパトリックは、英国を拠点とする AWS ソリューションエンジニアです。Connor は AWS ソリューションアーキテクトと協力して、標準化されたツール、コードサンプル、デモンストレーション、クイックスタートを作成しています。彼は熱心なボートの漕ぎ手、wobbly なサイクリスト、そして時折パン職人でもあります。
Franco Rezabek は、英国ロンドンを拠点とする AWS ソリューションエンジニアです。Franco は AWS ソリューションアーキテクトと協力して、標準化されたツール、コードサンプル、デモンストレーション、クイックスタートを作成しています。
Steve Engledow はソリューションエンジニアで、社内外の AWS のお客様と協力して、一般的な問題に対する再利用可能なソリューションを構築しています。
Christopher Lottは、AWS Language AI サービスチームのシニアソリューションアーキテクトです。彼は20年のエンタープライズソフトウェア開発経験があります。クリスはカリフォルニア州サクラメントに住んでおり、ガーデニング、航空宇宙、そして世界中を旅することを楽しんでいます。
翻訳はソリューションアーキテクトの小川翔が担当しました。原文はこちらです。