投稿日: Jul 17, 2018

Amazon Transcribe は、ユーザーが音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする、自動音声認識 (ASR) サービスです。Amazon Transcribe を使用して、音声や動画ファイルの文字起こしを行うことができます。近日中に Amazon Transcribe は、各話者を別のチャンネルに録音した音声の取扱いを改善するため、チャンネル統合という機能をサポートする予定です。たとえば、インタビューする側のステレオトラックは左チャンネルに、インタビューされる側は右チャンネルに保存されます。

コンタクトセンターはマルチチャンネルからの顧客の入電記録の文字起こしを作成しているため、このチャンネル統合機能を使用することで、多大な恩恵を受けることでしょう。エージェントと発信者は通常は別のチャンネルに録音されてから、単一のオーディオファイルにマージされます。たとえば、Amazon Connect のようなコンタクトセンターアプリケーションでは、エージェントとカスタマーのステレオオーディオチャンネルを別々に保存します。エージェントの音声は右チャンネルに保存されます。エンドカスタマーのような入電の音声はすべて、左チャンネルに保存されます。コンタクトセンターが送信した単一オーディオファイルを受け取った Amazon Transcribe は、2 つのチャンネルを識別して切り離し、チャンネルごとに各話者の文字起こしを行い、チャンネルラベル付きで両者がマージされた首尾一貫した記録を作成します。コンタクトセンターはチャンネルラベルを使用することでなお一層、それぞれの話者の話す内容を、より正確に効率よく識別して分析できるようになります。さらに、カスタマーは文字起こしのために音声をチャンネルごとに別々のオーディオファイルとして送信する必要がなくなり、コンタクトセンター全体のコストおよび作業負荷の両方を削減します。