投稿日: Nov 26, 2023

本日、自動音声認識 (ASR) を 100 以上の言語に拡張する、Amazon Transcribe の次世代の数十億パラメータの音声基盤モデル搭載システムを発表いたします。Amazon Transcribe は、お客様がアプリケーションに音声テキスト変換機能を簡単に追加できるようにする完全マネージド型 ASR サービスです。当社の音声基礎モデルは、言語やアクセントを問わず、人間の発話に内在する普遍的なパターンを学習するために、クラス最高の自己監視アルゴリズムを使用してトレーニングされています。

生成系 AI の出現により、何千もの企業が Amazon Transcribe を使用してオーディオコンテンツから豊富なインサイトを引き出し、オーディオおよびビデオコンテンツのアクセシビリティと検出可能性を高めています。例えば、コンタクトセンターは顧客からの電話を文字起こしして分析し、インサイトを識別して、その結果、顧客体験とエージェントの生産性を向上させます。コンテンツプロデューサーとメディア配信者は、コンテンツのアクセシビリティを高めるために、Amazon Transcribe を使用して字幕を自動的に生成します。

バッチモードで Amazon Transcribe を使用するすべての既存および新規のお客様は、API エンドポイントや入力パラメータを変更することなく、100 以上の言語の精度向上を実感できます。これらの新言語は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (香港)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (パリ)、欧州 (ストックホルム)、中東 (バーレーン)、南米 (サンパウロ) の各 AWS リージョンでご利用いただけます。開始するには、サービスコンソールにアクセスし、10 分間のチュートリアルを参照して音声の文字起こしを作成するか、詳細について、ブログ投稿ドキュメントを参照してください。