投稿日: May 11, 2021
Amazon Transcribe が部分的な結果の安定化のサポートを開始しました。これにより、ライブ字幕の使用感がさらに改善されます。Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。Amazon Transcribe は、ストリーミング音声コンテンツを処理する際に、連続的な音声のセグメントの最終的なトランスクリプトを提供するまで、部分的なトランスクリプション結果を生成します。しかし、Transcribe による音声のコンテキストの理解が進むにつれて、これらの部分的な結果の一部の語句が変化する可能性があります。部分的な結果の安定化により、文字起こしプロセス中に文字起こしがどの程度変化するかを定義することで、ビューワーがテキスト出力を読みやすくなります。
文全体が文字起こしされるのを待つ代わりに、部分的な結果の安定化レベルを制御できるようになりました。Transcribe には、高、中、低の 3 つの設定があります。安定化を「高」に設定すると、部分的な結果の大部分を修正でき、最後の数語だけが文字起こしプロセス中に変更されます。これにより、画面上で一度に 2 行の字幕を超えない小さなセグメントで、文字起こしの結果をビューワーに提示できます。さらに、部分的な結果の安定化により、ユーザーエクスペリエンスが向上し、レイテンシーが短縮されます。
部分的な結果の安定化により、動画の放送やゲーム内チャットのライブ字幕の使用感を改善できます。例えば、メディアのお客様は、Transcribe を使用して、ライブスポーツイベントにリアルタイムの字幕を使用してアクセシビリティを向上させたり、部分的な結果の安定化を使用してレイテンシーを短縮したりできます。また、ゲーム会社でも、文字起こしのストリーミングを使用してゲーム内チャットのアクセシビリティを改善し、聴覚障害者をサポートできます。コンタクトセンターは、このストリーミング文字起こし機能を使用して、エージェントが次善のアクションを実行するためにリアルタイムで通話内容を文字起こしできます。
ストリーミング音声の部分的な結果の安定化は、Amazon Transcribe が利用可能なすべての AWS リージョンでご利用いただけるようになりました。 使用を開始するには、「Amazon Transcribe の部分的な結果の安定化を使用してストリーミング文字起こしエクスペリエンスを改善」の記事をお読みいただき、Amazon Transcribe サービスコンソールでお試しください。詳細については、Amazon Transcribe の部分的な結果の安定化に関するドキュメントをご覧ください。