投稿日: Dec 7, 2022

本日、Amazon Transcribe カスタム言語モデル (CLM) が一括モードとストリーミングモードの両方で、ドイツ語と日本語をサポートするようになったことをお知らせします。Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。CLM を使用すると、既存のデータを使用して、特定の一括およびストリーミングの文字起こしのユースケースに対応したカスタム音声エンジンを構築できます。CLM を作成するために、事前の機械学習の経験は必要ありません。

CLM は、ウェブサイトのコンテンツ、取扱説明書、ドメインの固有の語彙を対象に含むその他のアセットなど、既に所有しているテキストデータを使用します。トレーニングデータセットをアップロードして CLM を作成し、新しい CLM を使用して文字起こしジョブを実行します。Amazon Transcribe CLM は、法律、金融、ホスピタリティ、保険、メディアなど、さまざまな領域で事業を営んでいるユーザー向けに提供されています。CLM はドメイン固有の音声の文字起こしの精度を向上させるように設計されています。これには、通常の日常会話では聞かれない内容も含まれます。例えば、科学会議の議事録を書き起こす場合、標準的な文字起こしでは、プレゼンターが使用する科学用語の多くが認識されない可能性があります。Amazon Transcribe CLM を使用すると、自分の専門分野で使用される専門用語を認識するようにカスタム言語モデルをトレーニングできます。

CLM はドイツ語と日本語での一括およびストリーミング文字起こしをサポートするようになり、Amazon Transcribe が稼働するすべての AWS リージョンで利用できます。独自のカスタム音声認識モデルの作成を開始するには、Amazon Transcribe のサービスコンソールにログインします。CLM 機能の詳細については、Amazon Transcribe の文字起こしのパフォーマンスを強化するカスタム言語モデルの構築の投稿をご覧ください。詳細については、Amazon Transcribe のドキュメントページをご覧ください。