Amazon Transcribe を使用すると、デベロッパーは音声をテキストに変換する機能をアプリケーションに簡単に追加できます。コンピュータでは、音声データを検索および分析することは事実上不可能です。したがって、録音された音声は、アプリケーションで使用する前にテキストに変換する必要があります。これまで、顧客はトランスクリプション提供者と協力して、費用のかかる契約に署名する必要があり、自らのテクノロジースタックに組み込みこんで、このタスクを行うことは困難でした。これらのプロバイダーの多くは、コールセンターで一般的な音質の低い通話音声など、さまざまなシナリオにうまく適合しない旧式のテクノロジーを使用しているため、精度が低下します。
Amazon Transcribe は、自動音声認識 (ASR、automatic speech recognition) と呼ばれる深層学習プロセスを使って迅速かつ高精度に音声をテキストに変換します。 Amazon Transcribe は、カスタマーサービスの通話の文字起こし、字幕の自動作成、完全に検索可能なアーカイブを作成する際におけるメディア資産のメタデータの生成に使用できます。Amazon Transcribe Medical を使用すると、医療関連の音声をテキストに変換する機能を臨床ドキュメントアプリケーションに追加できます。
ベネフィット
読みやすい文字起こしを作成する
Amazon Transcribe では話者ダイアライゼーション、句読点や書式が自動で追加されるので、わずかな時間と費用で、人の手による文字起こしに比べても遜色のない出力が仕上がります。スピーチからテキストへの処理は、テキスト読み上げのライブオーディオストリームまたはバッチオーディオコンテンツに適用できます。 詳細 »
顧客のプライバシーを確保
指示があった場合、Amazon Transcribe は、サポート言語のトランスクリプトから個人識別情報 (PII) を識別してリダクションできます。これにより、コンタクトセンターは、カスタマー体験の洞察を得てエージェントトレーニングを行うために、文字起こしを簡単に確認して共有できます。 詳細 »
ユースケース
ライブ通話の分析とエージェントの支援
コンタクトセンターは、Amazon Transcribe を使用してリアルタイムの通話記録と Amazon Comprehend を書き起こし、会話から通話の意図と感情を抽出することで、エージェントに実用的な洞察を提供できます。Contact Lens for Amazon Connect や AWS Contact Center Intelligence パートナープラットフォームなどの分析プラットフォームを使用して、エージェントの生産性を高め、スーパーバイザーに品質管理アラートを提供し、顧客体験を向上させることができます。
通話後分析
Amazon Transcribe を使用すると、コンタクトセンターは非構造化音声通話データ内に保持されている価値を引き出します。これらの音声通話をテキストに変換することにより、Amazon Transcribe を Amazon Comprehend などの他の AWS サービスと組み合わせて、通話後分析アプリケーションを構築し、顧客洞察の傾向と音声を特定できます。
臨床ドキュメント
医師や開業医は、Amazon Transcribe Medical を使用して、医師と患者の会話をテキストでデジタル化し、電子医療記録 (EHR) システムに入力したり、分析したりできます。このサービスは HIPAA の資格があり、医療用語を理解するようにトレーニングされています。Transcribe Medical を使用すれば、医師はドキュメントを使う場合より多くの患者のケアに集中できます。
メディアコンテンツの字幕
Amazon Transcribe を使用することで、コンテンツプロデューサーやメディア配信者は、タイムスタンプ付きの字幕を自動生成して動画コンテンツに表示し、コンテンツのリーチ拡大やアクセシビリティ向上を実現することができます。 次に、Amazon Translate を使用して字幕を翻訳することにより、ビデオを簡単にローカライズすることもできます。
メディアインテリジェンス
Amazon Transcribe を使用すれば、オーディオとビデオのアセットを完全に検索可能なアーカイブに自動的に変換して、ハイライトの生成、コンプライアンスの監視、コンテンツ使用量分析、および収益化を行うことができます。また、音声をテキストに変換し、Amazon Elasticsearch または Amazon Kendra を使って音声/動画ライブラリに対しインデックスを作成したり検索を実行したりできます。
デジタル筆記者と法廷記者
Amazon Transcribe をデジタル筆記として使用して、仕事の会議や教育上の講義やセミナーを正確に記録できます。法廷では、Amazon Transcribe はデジタル法廷レポーターとして行動し、公聴会や裁判、証拠、宣誓陳述、その他の法的手続きを記録することができます。
お客様事例
Intuit は、TurboTax と QuickBooks を含む革新的な財務管理ソリューションを世界約 5,000 万人のお客様にご提供しています。
顧客とのやり取りに毎年 2 億 7,500 万分以上を費やす Intuit では、正確な通話トランスクリプト、機密データのリダクション、およびコンタクトセンターの有効性を判断するための自動化されたコールメトリクスのために機械学習 (ML) 駆動のコンタクトセンター分析を提供する Contact Lens for Amazon Connect を利用しています。Contact Lens は、通話記録を生成するために音声をテキストに自動的に変換するサービスである Amazon Transcribe と、感情を抽出するための自然言語処理 (NLP) サービスである Amazon Comprehend を利用して、AWS ML サービスに基づいて構築されています。

NASCAR (全米自動車競争協会) は、ストックカーレースで知られるアメリカのオートレースの統括および運営会社です。
「Amazon Transcribe を 195 か国 29 言語で展開するマルチサイトウェブサイトで NASCAR の VOD コンテンツのキャプションを強化しました。Amazon Transcribe を使用して、ニーズに合わせて音声認識をカスタマイズする方法を制御する能力を持ちながら、チームのほぼすべての作業を自動化するシステムを構築することができました。Amazon Transcribe を実装して以来、私たちは VOD コンテンツの 99% にキャプションを自動で追加していますが、コストは最初の見積もりよりも 97% 少なくなっています。」
Patrick Carroll 氏、開発部門シニアディレクター – NASCAR
Audioburst は、会話音声の発見、配信、およびパーソナライズを変革しているテクノロジープロバイダーです。
「私たちは毎日 225,000 分のライブトークラジオ番組を分析して、プレイリストや検索用に、情報の短い時事的なセグメントを作成しています。Amazon Transcribe を選択したのは、それが下流のコンテンツ制作ワークストリームのためのライブオーディオコンテンツの文字起こしに役立つ優れた音声認識エンジンであるためです。Transcribe は、100 個のオーディオストリームをテキストに同時変換できる堅牢なシステムをリーズナブルなコストで提供します。この高品質出力テキストを使用することで、ライブトークラジオのエピソードを、次世代のリスニングエクスペリエンスを提供し、より優れたエンゲージメントを促進する消費可能なセグメントにすばやく処理することができます。」
Audioburst – 共同創設者兼 CTO、Gal Klein 氏