投稿日: Sep 24, 2020
Amazon Transcribe は、音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする自動音声認識 (ASR) サービスです。本日、Amazon Transcribe で AMR、AMR-WB、Ogg、WebM 形式のメディアファイルのネイティブサポート開始を発表します。以前は、これらのファイル形式を WAV、FLAC、MP3、MP4 などのサポートされている形式に変換する必要がありました。特に大規模なワークロードでは、余分なコストやスケーリングの課題が追加されていました。AMR、AMR-WB、Ogg、または WebM 形式のメディアファイルを直接 Transcribe API に送信できるようになりました。Amazon Transcribe は、Ogg と WebM 形式のファイルに対して、OPUS でエンコードされた音声をサポートします。
Amazon Transcribe を使用すると、音声や画像のコンテンツを入手やすく、発見しやすくなります。お客様は AMR 形式で録音されたボイスメールを書き起こして、ボイスメールを視覚化した形でユーザーに提供できます。カスタマーコンタクトセンターでは、Transcribe を使用して Ogg 形式の通話録音をテキストに直接変換し、データを分析してアクション可能な情報を得ることができます。また、メディアコンテンツ製作者は、一般的な WebM 形式の視聴覚メディアの字幕ワークフローを、他形式に変換をすることもなく自動化することができます。