Amazon Transcribe

音声をテキストに自動的に変換する

Amazon Transcribe を使用すると、開発者は音声をテキストに変換する機能をアプリケーションに簡単に追加できます。コンピュータでは、音声データを検索および分析することは事実上不可能です。したがって、録音された音声は、アプリケーションで使用する前にテキストに変換する必要があります。これまで、顧客はトランスクリプション提供者と協力して、費用のかかる契約に署名する必要があり、自らのテクノロジースタックに組み込みこんで、このタスクを行うことは困難でした。これらのプロバイダーの多くは、コールセンターで一般的な音質の低い通話音声など、さまざまなシナリオにうまく適合しない旧式のテクノロジーを使用しているため、精度が低下します。

Amazon Transcribe は、自動音声認識 (ASR、automatic speech recognition) と呼ばれる深層学習プロセスを使って迅速かつ高精度に音声をテキストに変換します。Amazon Transcribe は、カスタマーサービスの通話の文字起こし、クローズドキャプションや字幕の自動作成、完全に検索可能なアーカイブを作成する際におけるメディア資産のメタデータの生成に使用できます。 Amazon Transcribe Medical を使用すると、医療関連の音声をテキストに変換する機能を臨床ドキュメントアプリケーションに追加できます。

主な特徴

読みやすい文字起こし

Amazon Transcribe では句読点や書式が自動で追加されるので、わずかな時間と費用で、人の手による文字起こしに比べても遜色のない出力が仕上がります。

文字起こしのストリーミング

音声をバッチでまたはほぼリアルタイムで処理できます。セキュアな接続を使ってこのサービスにライブオーディオストリームを送信すると、折り返し、文字に起こされたテキストのストリーミングを受信できます。

タイムスタンプ生成

Amazon Transcribe では、すべての単語にタイムスタンプが付加されるので、オリジナルの録音音声で単語やフレーズを簡単に検索したり、動画に字幕を付けたりすることもできます。

カスタム語彙

基本語彙に新しい言葉を加えることで、製品名、技術用語、個人名など分野に固有の用語やフレーズを使用した、より高精度な文字起こしを生成することができます。

複数話者の認識

話者の交代を自動で認識してテキストに反映させ、電話、会議、テレビ番組などの会話のやりとりを高精度に読み取ります。

チャネルの識別

コールセンターが 1 個の音声ファイルを Amazon Transcribe に送信すると、このサービスはチャネルのラベルが付いた 1 件の文字起こしを自動で識別し生成します。

ユースケース

カスタマーサービスの向上

Amazon Transcribe は音声入力をテキストに変換できるので、音声入力の検索や分析を行うテキスト分析アプリケーションの構築に役立ちます。コールセンターでは、Amazon Transcribe を使用して通話の文字起こしを行い、さらに Amazon Comprehend など AWS の他のサービスを使用して対話の意味や意図を抽出して、データを処理しインサイトを取得可能です。

クローズドキャプションや字幕の作成ワークフロー

Amazon Transcribe を使用することで、コンテンツプロデューサーやメディア配信者は、タイムスタンプ付きの字幕を自動生成して動画コンテンツに表示し、コンテンツのリーチ拡大やアクセシビリティ向上を実現することができます。また、テキストを Amazon Translate と組み合わせることで動画を簡単にローカライズできます。

音声アーカイブのカタログ化

Amazon Transcribe を使うことで、音声アセットや動画アセットの文字起こしを行い、コンプライアンスモニタリングやリスク管理に利用できる完全に検索可能なアーカイブを構築することが可能です。また、音声をテキストに変換し、Amazon Elasticsearch を使って音声/動画ライブラリに対しインデックスを作成したり検索を実行したりできます。

Amazon Transcribe のお客様

Amazon Transcribe 料金の詳細

料金ページを見る
構築を始めましょう。
ご不明な点がおありですか?
お問い合わせ