投稿日: Jun 9, 2022
デベロッパーは AWS GovCloud (米国) リージョンで、Amazon Chime SDK のライブ文字起こしを使用して、ライブ音声の文字起こしができるようになりました。Amazon Chime SDK を使用すれば、デベロッパーはインテリジェントなリアルタイムでの音声、動画、画面共有を自身のウェブアプリケーションおよびモバイルアプリケーションに追加できます。AWS GovCloud (米国) により、米国政府関連機関や業者は、特定の規制およびコンプライアンス要件に対処しつつ、コミュニケーションワークロードをクラウドに移行できます。
Amazon Chime SDK により、デベロッパーは両方の AWS GovCloud (米国) リージョンで WebRTC メディアセッションをホストできます。Amazon Chime SDK と Amazon Transcribe の統合により、「誰が何を言ったか」がわかる文字起こし情報を各セッションの参加者に直接配信できるようになりました。各ユーザーの音声は個別に処理されるため、複数の人が会話する際の精度が向上しています。トップ 2 のアクティブトーカーの音声は、単一のストリームを経由し、別々のチャネルで Amazon Transcribe に送信されます。デベロッパーは文字起こし情報を使用して、機械生成によるリアルタイムのキャプションをレンダリングしたり、セッションの文字起こしを動的に作成したりできます。
ライブ文字起こしは AWS GovCloud (米国西部) リージョンで Amazon Transcribe を使用し、Amazon Transcribe でサポートされているすべてのストリーミング言語、ならびに自動言語識別、語彙フィルター、コンテンツ識別、カスタム語彙、カスタム言語モデルなどへのアクセスを提供します。標準の Amazon Transcribe コストが適用されます。
Amazon Chime SDK および Amazon Transcribe でのライブ文字起こしの詳細については、以下のリソースを確認してください。
- Amazon Chime SDK と Amazon Transcribe のウェブサイト
- Amazon Chime SDK デベロッパーガイドのライブ文字起こしの使用
- Amazon Chime SDK API リファレンスのライブ文字起こし API