投稿日: Jun 1, 2022
Amazon Transcribe は、音声をテキストに変換する機能をユーザーのアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。本日、バッチモードで多言語音声の自動言語識別に対応したことを発表します。音声録音に複数の言語が含まれている場合、多言語識別を有効にすると、音声ファイルで話されているすべての言語を識別し、識別された各言語を使用してトランスクリプトを作成することができます。これは、話し手が会話の途中で言語を変更した場合でも、または各参加者がそれぞれ異なる言語を話している場合でも、トランスクリプション出力が各言語を正しく検出して、書き起こすことを意味します。これまで、Transcribe は音声録音で主要な言語を検出し、識別された言語でトランスクリプトを生成していました。今後は、音声ファイルを提供するだけで、Transcribe が音声信号から言語を検出し、識別された言語でトランスクリプトを生成します。
複数の公用語がある国または複数の地域で事業を行っている場合、音声ファイルに異なる言語が含まれたり、言語間で切り替わったりすることがあります。最短 3 秒の音声があれば、Transcribe は人間が言語を指定しなくても、話し言葉で効率的にトランスクリプトを生成できます。これは、ユーザーとの通話内容の文字起こし、ボイスメールのテキストへの変換、会議のやり取りの記録、ユーザーフォーラムでのコミュニケーションの追跡、メディアコンテンツの制作とローカリゼーションのワークフローの監視など、さまざまなユースケースに適用されます。
多言語音声の自動言語識別は、現在一括書き起こしに対応している 37 言語全てに追加費用なしで対応しています。この機能は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (カリフォルニア北部)、米国西部 (オレゴン)、カナダ (中部)、アフリカ (ケープタウン)、アジアパシフィック (香港)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (パリ)、欧州 (ストックホルム)、中東 (バーレーン)、南米 (サンパウロ)、AWS GovCloud (米国西部) の各 AWS リージョンでご利用いただけます。詳細は、Amazon Transcribe のドキュメントページをご覧いただくか、AWS コンソールにアクセスしてお試しください。