投稿日: Nov 16, 2023

Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。本日、多言語ストリームの自動言語識別に対応したことを発表します。複数の公用語がある国または複数の地域で事業を行っている場合、音声ストリームに異なる言語が複数含まれたり、音声が言語間で切り替わったりすることがあります。このようなユースケースで多言語識別を有効にすると、ストリームで話されているすべての言語を識別し、識別された各言語を使用してトランスクリプトを作成できます。これは、話し手が会話の途中で言語を変更した場合でも、または各参加者がそれぞれ異なる言語を話している場合でも、トランスクリプション出力では各言語が正しく検出され、書き起こされることを意味します。

ライブストリーミングのトランスクリプションは、さまざまな業界で、コンタクトセンターのアプリケーション、ブロードキャストイベント、会議の字幕、e ラーニングに利用されています。最短 3 秒の音声があれば、Transcribe は人間が言語を指定しなくても、話し言葉で効率的にトランスクリプトを生成できます。

多言語音声の自動言語識別は、現在ストリーミングトランスクリプションがサポートされている 14 の言語すべてに対してサポートされ、追加料金はかかりません。また、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ)、アジアパシフィック (シンガポール)、アジアパシフィック (ソウル)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、アフリカ (ケープタウン)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、南米 (サンパウロ)、AWS GovCloud (米国西部) の各 AWS リージョンでご利用いただけます。詳細は、Amazon Transcribe のドキュメントページをご覧いただくか、AWS コンソールにアクセスしてお試しください。

23/11/21 – この投稿は、内容を正しく修正して AWS GovCloud (米国) リージョン (米国西部) を記載するために更新されました。