投稿日: Oct 20, 2021
Amazon Transcribe は、ストリーミング文字起こし用のカスタム言語モデル (CLM) をサポートするようになります。Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。CLM を使用すると、既存のデータを活用して、文字起こしのユースケースに合わせたカスタム音声エンジンを構築できます。事前の機械学習の経験は必要ありません。
ライブストリーミングトランスクリプションは、コンタクトセンターアプリケーション、ブロードキャストイベント、および e ラーニングの業界全体で利用されています。CLM を使用すると、業界固有の語彙を包含するウェブサイトのコンテンツや取扱説明書などのテキストデータを活用して、文字起こしの精度を向上させることができます。使用を開始するには、CLM をトレーニングするためにトレーニングデータセットをアップロードします。次に、新しい CLM を使用して文字起こしジョブを実行します。
ストリーミング文字起こしの CLM は、米国英語で利用でき、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、南米 (サンパウロ)、アジアパシフィック (ソウル)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、および欧州 (ロンドン) といった、Amazon Transcribe ストリーミングがサポートされている AWS リージョンでご利用いただけます。CLM 機能の詳細については、「Building custom language models to supercharge speech-to-text performance for Amazon Transcribe」のブログ投稿をお読みいただくか、Amazon Transcribe のドキュメントのページをご覧ください。