Amazon Transcribe 可让开发人员轻松地为其应用程序添加语音转文本功能。搜索和分析音频数据对于计算机而言几无可能。因此,需要先将录制的语音转换成文本,然后再将文本用于应用程序中。以往,客户不得不与转录提供商合作。提供商会要求客户签署昂贵的合同,同时也难以集成到客户的技术堆栈中以完成转录任务。许多提供商都使用过时的技术,无法很好地适应不同的情况(例如联络中心常见的低保真度通话录音),从而导致转录准确性较差。
Amazon Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程,快速准确地将语音转换为文本。 Amazon Transcribe 可用于转录客户服务电话、自动添加对白字幕,以及为媒体资产生成元数据以创建完全可搜索的存档。您可以使用 Amazon Transcribe Medical 将医疗语音转文本功能添加到临床文档应用程序。
使用案例
实时呼叫分析和代理协助
联系中心可以通过使用 Amazon Transcribe 来创建实时呼叫转录并使用 Amazon Comprehend 从谈话中提取呼叫意图和情绪,从而为其代理提供可行的见解。您可以使用诸如 Contact Lens for Amazon Connect 或 AWS Contact Center Intelligence 合作伙伴平台之类的分析平台来提高代理生产效率、向主管提供质量管理警报并改善客户体验。
呼叫后分析
利用 Amazon Transcribe,联系中心可以开始释放非结构化语音呼叫数据中包含的价值。通过将这些语音呼叫转换为文本,Amazon Transcribe 可以与 Amazon Comprehend 之类的其他 AWS 服务相结合,以构建发布呼叫分析应用程序来识别客户见解的趋势和语音。
临床文档
医生和医疗从业者可以使用 Amazon Transcribe Medical 快速高效地将医生与患者的对话数字化为文本,以输入到电子病历 (EHR) 系统中进行分析。该服务符合 HIPAA 要求,并经过了训练,了解医学术语。使用 Transcribe Medical,医生可以更多地关注患者护理,而不是记录。
添加媒体内容对白字幕
Amazon Transcribe 可以自动生成带时间戳的字幕(随视频内容一起显示),从而帮助内容生成者和媒体发行者提高到达率和可访问性。 然后,您还可以通过使用 Amazon Translate 翻译字幕来轻松地本地化视频。
媒体智能
您可以使用 Amazon Transcribe 将音频和视频资产自动转换为完全可搜索的存档,以便实现突出显示生成、合规监控、内容使用分析和盈利。将音频转换为文本并使用 Amazon Elasticsearch 或 Amazon Kendra 在您的整个音频/视频库中编制索引和搜索。
数字抄写员和法庭记者
Amazon Transcribe 可用作数字抄写员,以准确记录工作会议或教育讲座和研讨会。在法庭中,Amazon Transcribe 可以担任数字法庭记者,记录听证会和审判、口供、宣誓证词和其他诉讼程序。
客户案例
Intuit 是创新型财务管理解决方案提供商,面向全球大约 5000 万客户提供服务,他们的产品有 TurboTax 和 QuickBooks 等。
Intuit 每年要处理超过 2.75 亿次客户交互,它使用提供机器学习 (ML) 支持的联络中心分析的 Contact Lens for Amazon Connect,从而提供准确的呼叫转录、敏感数据修订和自动呼叫指标,以确定其联络中心的有效性。Contact Lens 构建于 AWS ML 服务之上,使用自动将语音转换为文本的服务 Amazon Transcribe 生成呼叫转录,并使用自然语言处理 (NLP) 服务 Amazon Comprehend 提取情绪。

美国全国运动汽车竞赛协会 (NASCAR) 是一家美国汽车竞赛审批和运营公司,以赛车而闻名。
“我们选择使用 Amazon Transcribe,在我们覆盖 195 个国家或地区以及 29 种语言的多站点网站上为 NASCAR 的点播内容提供字幕。利用 Amazon Transcribe,我们建立了一个自动化的系统,这个系统几乎不需要我们的团队进行操作,同时让我们能够自定义自己需要的语音识别功能。应用了 Amazon Transcribe 之后,我们为 99% 的点播内容自动添加了字幕,并且费用比我们最初的估计少 97%。”
Patrick Carroll,NASCAR 发展部高级总监
Audioburst 是一家让谈话音频的发现、分发和个性化发生了转变的技术提供商。
“每天,我们分析 225,000 分钟的实时电台访谈,以形成数以千计的关于播放列表和搜索的短主题片段。我们选择 Amazon Transcribe 是因为它作为出类拔萃的语音识别引擎,可帮助我们转录实时视频内容,用于下游内容制作工作流。Transcribe 提供了强大的系统,可以按合理的成本同时将一百个音频流转换成文字。然后,我们可以利用这些高质量的输出文字快速地将实时电台访谈节目处理成可消耗的片段,提供下一代收听体验并促进更高的参与度。”
Gal Klein,Audioburst 联合创始人兼首席技术官