投稿日: Mar 11, 2021

Amazon Transcribe は、デベロッパーが音声の文字起こし機能を音声対応アプリケーションに簡単に追加できるようにする、自動音声認識 (ASR) サービスです。これまで、Amazon Transcribe は、バッチ (非同期) API の文字起こし出力で各単語の信頼度スコアを提供してきました。本日から、Amazon Transcribe は文字起こしのストリーミング (同期) API でも単語レベルの信頼度スコアを提供します。

信頼度スコアは、単語の文字起こしの精度に関するサービスの自己評価です。精度測定と混同しないよう注意してください。各単語には 0~1 の信頼度スコアが関連付けられます。これらのスコアは、テキスト書き起こしの後処理ロジックを実装する多くの機会をデベロッパーに提供します。例えば、キーワード検索、翻訳、または人によるレビューなどの後処理用の特定の信頼度しきい値を満たす用語だけを使用する場合があります。どのような音声認識アプリケーションであっても、信頼度スコアは、特定のストリーミング音声のユースケースを拡張または使用するための追加ツールを提供します。ストリーミング文字起こしの一般的なユースケースの例には、リアルタイムの通話文字起こしや放送メディアのライブキャプションなどがあります。
文字起こしのストリーミングでの単語レベルの信頼度スコアは、Amazon Transcribe ストリーミング API が使用可能なすべての AWS リージョンで使用可能です。今すぐ サービスコンソールにアクセスしてお試しください。詳細についえは、 技術文書を参照してください。