Amazon Transcribe

自动将语音转换为文本

Amazon Transcribe 可让开发人员轻松地为其应用程序添加语音转文本功能。搜索和分析音频数据对于计算机而言几无可能。因此,需要先将录制的语音转换成文本,然后再将文本用于应用程序中。以往,客户不得不与转录提供商合作。提供商会要求客户签署昂贵的合同,同时也难以集成到客户的技术堆栈中以完成转录任务。许多提供商都使用过时的技术,无法很好地适应不同的情况(例如联络中心常见的低保真度通话录音),从而导致转录准确性较差。

Amazon Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程,快速准确地将语音转换为文本。Amazon Transcribe 可用于转录客户服务电话、自动添加隐藏式屏幕文字和对白字幕,以及为媒体资产生成元数据以创建完全可搜索的存档。 您可以使用 Amazon Transcribe Medical 将医疗语音转文本功能添加到临床文档应用程序。

主要功能

便于阅读的转录

Amazon Transcribe 可自动添加标点和格式,这样输出几乎可与手动转录的品质相媲美,而且只需很少的时间和费用。

流式转录

您可以批量或近乎即时地处理音频。使用安全连接,您可以将实时音频流发送到服务,并且可以接收到文本流作为响应。

生成时间戳

Amazon Transcribe 会为每个词返回时间戳,以便您可以在原始录音中轻松找到词或词组,或者为视频添加对白字幕。

自定义词汇表

您可以将新词添加到基本词汇表中,以便为域特定的词和词组生成更准确的转录,例如产品名称、技术术语或个人姓名。

识别多个讲话者

可自动识别讲话者变更并反映在文本中,以准确捕获电话通话、会议和电视节目等场景。

声道识别

联络中心可将单个音频文件提交到 Amazon Transcribe,然后该服务将自动识别并制作由声道标签注明的单个脚本。

使用案例

改善客户服务

通过将音频输入转换成文本,Amazon Transcribe 可帮助您构建能够搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用 Amazon Transcribe 转录通话,并借助其他 AWS 服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取见解。

添加屏幕文字和对白字幕工作流程

Amazon Transcribe 可以自动生成带时间戳的字幕(随视频内容一起显示),从而帮助内容生成者和媒体发行者提高到达率和可访问性。通过将此文本与 Amazon Translate 相结合,您还可以将视频轻松本地化。

音频存档分类

您可以使用 Amazon Transcribe 将音频和视频资源转录成完全可搜索的存档,以便进行合规性监控和风险管理。将音频转换为文本并使用 Amazon Elasticsearch 在您的整个音频/视频库中编制索引和搜索。

Amazon Transcribe 客户

了解有关 Amazon Transcribe 定价的更多信息

访问定价页面
准备好开始构建了吗?
还有更多问题?
联系我们