投稿日: Sep 17, 2020
Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。Amazon Transcribe は、Channel Identification のサポートをストリーミング音声文字起こしに拡張しました。Channel Identification を使用すると、複数のチャネルからのライブ音声を処理し、チャネルラベルを使用して単一の会話のトランスクリプトを作成できます。
コンタクトセンターでは、アプリケーションは多くの場合、1 回のライブコール中に発信者とエージェントの両方の音声チャネルからのコンテンツを分析するように設計されています。Channel Identification を使用することで、お客様は、ライブ音声ストリーム内から複数のチャネルを分離して、各音声チャネルにラベルを付けるトランスクリプトを生成できるようになりました。メディアおよびエンターテインメントでは、マルチチャネル音声を含むコンテンツを生成することも一般的です。たとえば、ライブのオンライントークショーでは、ホストとゲストが別々のマイクに向かって話します。2 つの音声チャネルは、リアルタイムブロードキャストのために単一の音声ストリームに統合されます。Channel Identification を使用すると、ユーザーは、ホストチャネルとゲストチャネルを個別にリアルタイムで文字起こしすることで、ライブの字幕を生成できます。