Amazon Transcribe

音声をテキストに自動的に変換する

Amazon Transcribe を使用すると、デベロッパーは音声をテキストに変換する機能をアプリケーションに簡単に追加できます。コンピュータでは、音声データを検索および分析することは事実上不可能です。したがって、録音された音声は、アプリケーションで使用する前にテキストに変換する必要があります。これまで、顧客はトランスクリプション提供者と協力して、費用のかかる契約に署名する必要があり、自らのテクノロジースタックに組み込みこんで、このタスクを行うことは困難でした。これらのプロバイダーの多くは、コールセンターで一般的な音質の低い通話音声など、さまざまなシナリオにうまく適合しない旧式のテクノロジーを使用しているため、精度が低下します。

Amazon Transcribe は、自動音声認識 (ASR、automatic speech recognition) と呼ばれる深層学習プロセスを使って迅速かつ高精度に音声をテキストに変換します。Amazon Transcribe は、カスタマーサービスの通話の文字起こし、クローズドキャプションや字幕の自動作成、完全に検索可能なアーカイブを作成する際におけるメディア資産のメタデータの生成に使用できます。 Amazon Transcribe Medical を使用すると、医療関連の音声をテキストに変換する機能を臨床ドキュメントアプリケーションに追加できます。

利点

読みやすい文字起こしを作成する

Amazon Transcribe では話者ダイアライゼーション、句読点や書式が自動で追加されるので、わずかな時間と費用で、人の手による文字起こしに比べても遜色のない出力が仕上がります。スピーチからテキストへの処理は、テキスト読み上げのライブオーディオストリームまたはバッチオーディオコンテンツに適用できます。 詳細 »

顧客のプライバシーを確保

指示があった場合、Amazon Transcribe は、サポート言語のトランスクリプトから個人識別情報 (PII) を識別してリダクションできます。これにより、コンタクトセンターは、カスタマー体験の洞察を得てエージェントトレーニングを行うために、文字起こしを簡単に確認して共有できます。 詳細 »

カスタマイズされた文字起こしで精度を向上

カスタム語彙リストとカスタム言語モデルを使用すると、基本語彙に新しい言葉を加えることで、独自の言語モデルをトレーニングして、製品名、技術用語、個人名など分野に固有の用語やフレーズを使用した、より高精度な文字起こしを生成することができます。 詳細 »

特定の単語をフィルタリング

必要に応じて、Amazon Transcribe を使用すると、語彙フィルタリングを使用して、冒とく的または不適切な単語を文字起こし結果からマスクまたは削除できます。 詳細 »

ユースケース

カスタマーエクスペリエンス

カスタマーコンタクトセンターは、Amazon Transcribe を使用してライブのカスタマーコールと Amazon Comprehend などの他の AWS サービスを書き起こし、会話から通話の意図と感情を抽出することで、エージェントに実用的な洞察を提供できます。これらの洞察は、エージェントをリアルタイムで支援し、監督者に品質管理アラートを提供して、より良い顧客体験を生み出すことができます。

通話後の分析

Amazon Transcribe を使用すると、コンタクトセンターは非構造化音声通話データ内に保持されている価値を引き出します。これらの音声通話をテキストに変換することにより、Amazon Transcribe を Amazon Comprehend などの他の AWS サービスと組み合わせて、通話後分析アプリケーションを構築し、顧客洞察の傾向と音声を特定できます。

臨床会話の文書化

医師や開業医は、Amazon Transcribe Medical を使用して、医師と患者の会話をテキストでデジタル化し、電子医療記録 (EHR) システムに入力したり、分析したりできます。このサービスは HIPAA に準拠しており、医療用語を理解するようにトレーニングされています。Transcribe Medical を使用すれば、医師はドキュメントを使う場合より多くの患者のケアに集中できます。

キャプションや字幕のワークフロー

Amazon Transcribe を使用することで、コンテンツプロデューサーやメディア配信者は、タイムスタンプ付きの字幕を自動生成して動画コンテンツに表示し、コンテンツのリーチ拡大やアクセシビリティ向上を実現することができます。また、テキストを Amazon Translate と組み合わせることで動画を簡単にローカライズできます。

音声アーカイブのカタログ化

Amazon Transcribe を使うことで、音声アセットや動画アセットの文字起こしを行い、コンプライアンスモニタリングやリスク管理に利用できる完全に検索可能なアーカイブを構築することが可能です。また、音声をテキストに変換し、Amazon Elasticsearch を使って音声/動画ライブラリに対しインデックスを作成したり検索を実行したりできます。

デジタル筆記者と法廷記者

Amazon Transcribe をデジタル筆記として使用して、仕事の会議や教育上の講義やセミナーを正確に記録できます。法廷では、Amazon Transcribe はデジタル法廷レポーターとして行動し、公聴会や裁判、証拠、宣誓陳述、その他の法的手続きを記録することができます。

お客様事例

Echo360 は、授業前後と授業中の学生の積極性を高めるため、講師と学生によるインタラクティブな動画の録画、ストリーミング、管理、共有を可能にした動画プラットフォーム技術です。

「Echo360 プラットフォームは、今どきの学生のために、アクティブに参加できる動画ベースの学習を推進します。Amazon Transcribe によって、パートナーとなっている大学がそれぞれのビデオに高品質のスクリプトを付けられるようになりました。教育的動画コンテンツの検索の強化、字幕コストの引き下げ、ノートの取りやすさの改善が実現され、学生にとっては学習資産の価値が高まり、利用しやすくなりました」

Fred Singer 氏 – Echo360、CEO

Echo360 の導入事例を読む >>

GE Appliances では、世界トップクラスの電化製品をデザインし、製造することで生活を向上させています。デザイン、生産、サービスといった一連の流れの中で、当社の目標は、お客様が自宅での生活を向上させるためのサポートを行うことです。

「GE Appliances では、毎月、数百万分ものカスタマーコールを処理しています。Amazon Connect、Amazon Lex、Amazon Polly を使用することで、製品情報の検索、顧客情報の記録、エージェントにつなぐ前の一般的な質問への回答といった単純な作業を自動化できています。このことにより、最も貴重な商品とも言える時間をお客様にお返しできています。また、Amazon Transcribe を取り入れて、自動分析用に通話の文字起こしを実行し、継続的にプロセスを改善しています」

Byron Guernsey 氏 – GE Appliances、最高戦略責任者

VidMob は大手の動画作成プラットフォームで、ブランドや広告業者向けにあらゆる領域の動画コンテンツを作成する世界中のプロフェッショナルクリエイターによってネットワークが利用されています。

「Amazon Comprehend と Amazon Transcribe のおかげで、VidMob では高品質の機械学習テキスト分析を Agile Creative Suite に組み込むことができ、かつてない方法でブランドのクライアントにコンテンツのパフォーマンスを把握してもらえるようになりました。動画コンテンツを文字に変換して Comprehend ですばやく分析できるので、行動につながるインサイトをクリエイターコミュニティーとクライアントの両方に提示し、市場での戦略的優位性につなげてもらうことができます」

Alex Collmer 氏、VidMob、CEO

ブログ

Transcribe ブログにアクセスして、独自のユースケース、ベストプラクティス、詳細な技術分析、新たに発表された機能についてご覧ください。 
Product-Page_Standard-Icons_01_Product-Features_SqInk
製品の特徴を見る

Amazon Transcribe の特徴ページをご覧ください。

詳細 
Product-Page_Standard-Icons_03_Start-Building_SqInk
コンソールで構築を開始する

AWS マネジメントコンソールで Amazon Transcribe を使った構築を始めましょう。

サインイン