投稿日: Aug 11, 2021
Amazon Chime SDK を使用すれば、デベロッパーはリアルタイムでのオーディオ、動画、画面共有を自身のウェブアプリケーションおよびモバイルアプリケーションに追加できます。本日より、デベロッパーは Amazon Transcribe または Amazon Transcribe Medical を利用したライブの音声書き起こしを用いて、字幕を重ね合わせ、文字起こしを作成し、リアルタイムのコンテンツ分析を実施することができます。
音声が AWS ネットワークから離れることなくリアルタイムのミーティングの文字起こしを作成するために、Amazon Chime SDK にユーザーの Amazon Transcribe アカウントへのサービス側の統合が含まれるようになりました。ダブルトークのシナリオでの正確さの改善のために、ユーザーの音声は、ミーティングに混入する前に別途処理されます。Amazon Chime はアクティブトーカーアルゴリズムを使用して、トップ 2 のアクティブトーカーを選択し、彼らの音声を Amazon Transcribe に、別のチャネルで、シングルストリームを介して送信します。レイテンシーの削減のために、ユーザーに起因する文字起こしは、データメッセージを介してすべてのミーティング参加者に直接送信されます。ミーティングの音声をキャプチャするためにメディアパイプラインを使用する際は、ミーティングの文字起こし情報もキャプチャされます。
デベロッパーは、Amazon Transcribe がサポートするすべてのストリーミング言語、およびカスタムボキャブラリーやボキャブラリーフィルターなどの機能にアクセスできます。Amazon Transcribe Medical を使用する際は、デベロッパーは専門知識、会話タイプを選択して、オプションでカスタムボキャブラリーを提供することができます。Standard Amazon Transcribe および Amazon Transcribe Medical の費用が適用されます。
Amazon Chime SDK および Amazon Transcribe や Amazon Transcribe Medical でのライブの文字起こしの詳細については、以下のリソースを確認してください。