投稿日: Aug 6, 2020

Amazon Transcribe のカスタム言語モデル (CLM) のリリースを発表いたします。Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。辞書にない用語の音声認識を強化するカスタム語彙機能とは異なり、CLM では、既存のデータを活用して、文字起こしのユースケースに合わせたカスタム音声エンジンを構築できます。Amazon Transcribe は、法律、金融、ホスピタリティ、保険、メディアなど、さまざまな分野でご活用いただけます。

CLM は、ユーザーが既に所有しているテキストデータ (ウェブサイトのコンテンツ、取扱説明書、その他の運用ドメインを表すアセットなど) を利用するため、簡単に使用できます。トレーニングデータセットをアップロードし、モデル開発を初期化して、構築したカスタムモデルで文字起こしジョブを実行するだけです。さらに、CLM を使用するために事前の機械学習の経験は必要ありません。プロセスは完全に自動化されており、行う必要のある操作は最小限に抑えられています。

リリース時点において、CLM は米国英語をサポートし、Amazon Transcribe が利用可能なすべての AWS リージョンで利用できます。独自のカスタム音声認識モデルの作成を開始するには、Amazon Transcribe のサービスコンソールにログインします。CLM 機能の詳細については、Amazon Transcribe のドキュメントページを参照してください。