Amazon Transcribe

自动语音识别

Amazon Transcribe 是一种自动语音识别 (ASR) 服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。

Amazon Transcribe 可用于很多常见应用程序,包括客户服务通话转录,以及在音频和视频内容上生成字幕。该服务可以转录以常见格式 (例如 WAV 和 MP3) 存储的音频文件,并为每个词附加时间戳,以便您可以通过搜索文本轻松找到原始来源中的音频。Amazon Transcribe 正在不断学习和改进,以跟上语言的发展。

AWS re:Invent 2017:Amazon Transcribe 简介

主要功能

便于阅读的转录

大多数语音识别系统输出的都是一连串没有标点符号的文本。Amazon Transcribe 采用深度学习功能自动添加标点符号和格式,从而使输出内容更便于阅读,无需进一步编辑即可直接使用。

支持电话音频

从电话通话录制的音频通常质量很低。Amazon Transcribe 经过专门设计,可在处理电话质量音频时提供高准确度,以便支持客户服务通话转录等使用案例。 

多种语言

Amazon Transcribe 可以自动转录美式英语和西班牙语的语音,未来还将支持更多语种。    

 

简单易用的 API

Amazon Transcribe API 可轻松将语音转换成文本,无需复杂的编程。只需使用几行代码调用 API,Transcribe 即可返回 Amazon S3 中存储的音频文件的文本。

支持自定义词汇 (即将推出)

使用 Amazon Transcribe 时,您可以扩展和自定义语音识别词汇表。您可以将新单词 (连同其发音) 添加到基本词汇表中,并针对您的使用案例生成高度精确的转录,即使这些话语中可能包含专业术语和行话,或者独特的产品名称。此功能消除了未来修正的麻烦,可帮助您节省时间,并免去了更多的编辑工作。

生成时间戳

Amazon Transcribe 会为每个词返回时间戳,以便您可以通过搜索文本轻松找到原始录音中的音频。

 

识别多个讲话者 (即将推出)

Amazon Transcribe 能够识别出讲话者的变更,并相应地确定转录文本的属性。这可以显著减少转录具有多个讲话者的音频 (例如电话、访谈和电视节目) 的工作量。

使用案例

Amazon Transcribe 可以为广泛的使用案例提供转录服务,包括客户服务、字幕、搜索与合规性。

改善客户服务

通过将音频输入转换成文本,Amazon Transcribe 可帮助您构建能够搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用 Amazon Transcribe 转录语音通话,并借助其他 AWS 产品 (例如 Amazon Comprehend) 挖掘数据以提取对话中的含义和意图,从而获取见解。

字幕工作流

Amazon Transcribe 可以自动生成带时间戳的字幕 (随视频内容一起显示),从而帮助内容生成和媒体发行者提高到达率和访问量。

音频存档分类

借助该服务,您可以将音频和视频资源转录成完全可搜索的存档,以便进行合规性监控和风险管理。客户可以使用 Amazon Transcribe 将音频转换成文本,使用 Amazon ElasticSearch 在音频/视频库内编写索引并执行基于文本的搜索。

客户参考案例

RingDNA 是一个企业销售加速引擎和语音沟通平台。内部销售团队可使用 RingDNA 来显著提高生产力、开展更为明智的销售对话、获取预测性销售洞察力并培训销售代表,从而以超出以往的速度获取成功。 

“RingDNA 是一个面向销售团队的端到端沟通平台。数百家企业利用 RingDNA 来显著提高生产力、开展更为明智的销售对话、获取预测性销售洞察力、提高获胜率并培训销售代表,意图以超出以往的速度获取成功。Conversation AI 是 RingDNA 的一个重要组成部分,它需要最出色的语音转文本功能,以实现每次通话的转录。RingDNA 对 Amazon Transcribe 很感兴趣,因为它能够提供规模化的高质量语音识别,可以帮助我们更好地完成每一项语音转录任务。”

Howard Brown – RingDNA 首席执行官兼创始人

Isentia 是亚太地区领先的媒体情报提供商,总部位于澳大利亚悉尼。该公司在亚太地区设有 18 个办事处,为全球 5000 多名客户提供支持,其中包括世界 100 强品牌中的 84 个。Isentia 的产品可以帮助客户做出更明智、更及时的业务和沟通决策。

“在 Isentia,我们帮助客户分析和监控其品牌的媒体覆盖率。每天,我们都会创建超过 13000 条广播和电视节目内容摘要。借助 Amazon Transcribe,我们可以转录所有音频/视频内容,然后使用 Amazon Clair 监控和分析这些文本数据。时间戳和标点符号等功能让我们能够非常轻松地搜索数据并深入挖掘,并为我们的客户提供重要见解以供其参考。”

Andrea Walsh – Isentia 首席信息官

了解有关 Amazon Transcribe 定价的更多信息

访问定价页面
准备好开始使用?
注册预览版
还有更多问题?
联系我们