投稿日: Mar 28, 2019
Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする、完全マネージド型の自動音声認識 (ASR) サービスです。カスタム発音と表示フォームのサポートが Amazon Transcribe に追加されました。これによりカスタム語彙機能が強化されます。
カスタム語彙を作成することによって、入力音声またはビデオファイル内の音声の処理方法について、Amazon Transcribe に詳細情報を提供できます。カスタム語彙とは、音声入力の中で Amazon Transcribe に認識させたい特定の語句のリストです。一般的に、ドメイン固有の語句やフレーズ、Amazon Transcribe が認識しない語句、あるいは固有名詞がこれにあたります。
各用語それぞれに国際音声記号 (IPA) を使用したカスタム発音を指定することによって、カスタム語彙を強化することができるようになりました。また、その言語の標準的な正書法を使用して、単語やフレーズの発音方法を模倣することもできます。
さらに、文字起こしの際に用語をどのように表示するかも指定できるようになりました (「Street」を「ST」ではなく「St.」と表示するなど)。
カスタム語彙を強化するカスタム発音と表示フォームは、Amazon Transcribe が提供されているすべてのリージョンで利用可能です。新しいカスタム語彙機能は Amazon Transcribe コンソールからお試しいただけます。また、コマンドラインインターフェイス (CLI) や AWS SDK を使用することもできます。詳細については、ドキュメントページを参照してください。