投稿日: Mar 11, 2022
Amazon Chime SDK を使用すれば、デベロッパーはリアルタイムでの音声、動画、画面共有を自身のウェブアプリケーションおよびモバイルアプリケーションに追加できます。ライブ文字起こしは、Amazon Transcribe との統合により、字幕やトランスクリプトとして使用するためのライブ音声の文字起こしを生成するものです。本日より、デベロッパーは自動言語識別を使用して、話された言語を検出し、その言語での文字起こしを生成することができます。
ライブ文字起こしは、Amazon Transcribe のアカウントを使用して、上位 2 名のアクティブトーカーの音声を処理し、データメッセージですべての会議参加者にユーザー属性の文字起こしを配信します。今日まで、会議の言語は手動で選択する必要がありました。Amazon Transcribe では、最低 3 秒の音声があれば、主な言語を自動的に識別し、トランスクリプトを生成することができます。識別された言語は、データメッセージで提供され、希望するユーザーインターフェイスに組み込むことができます。
デベロッパーは、Amazon Transcribe がサポートするすべてのストリーミング言語、およびボキャブラリーフィルター、コンテンツ識別、カスタムボキャブラリー、カスタム言語モデルなどの機能にアクセスできます。標準の Amazon Transcribe コストが適用されます。
Amazon Chime SDK および Amazon Transcribe でのライブ文字起こしの詳細については、以下のリソースを確認してください。
- Amazon Chime SDK と Amazon Transcribe ウェブサイト
- Amazon Chime SDK デベロッパーガイドのライブ文字起こしの使用
- Amazon Chime SDK API リファレンスのライブ文字起こし API