Amazon Transcribe 是一项基于语音基础模型的自动语音识别(ASR)服务,支持 100 多种语言。Transcribe 的功能使您能够采集音频输入、生成易于阅读和审查的转录、通过自定义提高准确性,以及筛选内容进而确保客户隐私。

音频输入

Transcribe 旨在处理实时和录制的音频或视频输入,为搜索和分析提供高质量的转录。我们还提供单独的 API,它们能以独特方式理解客户呼叫(Amazon Transcribe 通话分析功能)和医疗对话(Amazon Transcribe Medical)。

流式传输和批量转录

您可以处理现有的录音或流式传输音频以进行实时转录。使用安全连接,您可以将实时音频流发送到服务,并且可以接收到文本流作为响应。

音频输入

针对特定领域的模型

选择适合电话或多媒体视频内容的模型。例如,Transcribe 可适应联络中心常见的低保真度电话音频。

自动语言识别

使用 Amazon Transcribe,您可以自动识别音频文件中的主要语言并生成转录文本。当您的媒体库包含不同语言的音频文件时,此功能很有用。您还可以使用此功能对媒体内容进行分类,并验证视频和播客中的主要口头语是否已正确标记。

易于阅读的转录文本

Amazon Transcribe 使您可以生成准确的笔录,以便阅读、查看并集成到您的特定应用程序中。我们努力使输出为下游活动(例如通话记录分析、字幕制作和内容搜索)做好准备。

标点符号和数字标准化

Amazon Transcribe 可自动添加标点和数字格式,这样输出几乎可与手动转录的品质相媲美,而且只需很少的时间和费用。数字也被转录成数字或“标准形式”,而不是单词。

易于阅读的转录文本

生成时间戳

Amazon Transcribe 会为每个词返回时间戳,以便您可以在原始录音中轻松找到词或词组,或者为视频添加对白字幕。

识别多个讲话者

可自动识别讲话者变更并反映在文本中,以准确捕获电话通话、会议和电视节目等场景。了解有关讲话者识别的更多信息。

声道识别

联络中心可将单个音频文件提交到 Amazon Transcribe,然后该服务将自动识别并制作由声道标签注明的单个脚本。

自定义输出

准确性至关重要,我们为您提供了许多选项,可以根据您的特定业务需求和方言自定义转录文本。Transcribe 还为每句话提供多达 10 个备选转录文本,因此您可以快速选择适用于您的内容和领域的最佳选项。这对于人工循环字幕制作工作流程很有用。

自定义词汇表

通过自定义词汇表,您可以将新词添加到基本词汇表中,以便为域特定的词和词组生成更准确的转录,例如产品名称、技术术语或个人姓名等。

自定义输出

自定义语言模型

需要时,您可以向 Amazon Transcribe 提交文本数据语料库,为您的应用场景和领域构建和训练自己的自定义语言模型(CLM)。CLM 功能适用于使用您自己的数据提高语音识别准确性。

用户安全和隐私功能

确保客户隐私和安全至关重要。需要时,Transcribe 使您可以掩蔽或移除转录结果中敏感或不适合您的受众的词语。

词汇表筛选

您可以使用词汇表筛选指定要从转录中删除的词列表。例如,您可以指定污秽或污蔑性词列表,Amazon Transcribe 会自动将其从转录中删除。

用户安全和隐私功能

自动内容修订/PII 修订

收到指示后,Amazon Transcribe 可以帮助客户从支持的语言转录中识别并修订敏感的个人身份信息(PII)。这样一来,联络中心便可以轻松查看和分享客户体验见解和座席培训的转录文本。

数据保护

使用 Amazon S3 密钥(SSE-S3)保护静态数据或指定您自己的 AWS Key Management Service 密钥。Amazon Transcribe 使用 TLS(传输层安全性)1.2,这是一种加密协议,支持经过身份验证的连接和通过 HTTP 通过互联网进行安全数据传输,并使用 AWS 证书对传输中数据进行加密。这包括流式转录。 

毒舌音频内容检测

Amazon Transcribe 毒舌监察功能通过机器学习保证音频对话文明且有建设性,以鼓励营造一个安全和包容的在线环境。毒舌音频内容被标记为几个类别之一,以便人工审核员轻松识别并采取适当措施。 

Amazon Transcribe 通话分析功能

使用 Amazon Transcribe 通话分析功能提取通话情绪和语音音量等对话见解,以提高座席的工作效率和客户体验。

通过生成式人工智能驱动的通话摘要提高联络中心的工作效率

自动生成通话摘要,以帮助座席专注于提供卓越的客户体验,并通过减少通话后的手动摘要来提高工作效率。此功能可提取与来电者的互动摘要,捕捉关键要素,如客户来电的原因、问题的解决方式以及确定的后续行动。 联络中心主管可以在调查来电者问题时通过查看通话摘要来快速了解互动的背景,而无需阅读整个转录。

提取详细的呼叫分析和对话见解

利用机器学习的力量,您可以快速应用语音转文本和自然语言处理功能来揭示有价值的对话见解。随后,您可以将见解整合到入站和出站呼叫分析应用程序中,这些见解包括客户和座席情绪、检测到的问题以及语音特征(例如非通话时间、中断次数和说话速度)等等。这样可以帮助您的主管更方便地确定潜在的客户问题、座席辅导机会和呼叫趋势。

Amazon Transcribe 通话分析功能

利用自动化的呼叫分类,提高合规性和改进监控

大规模监控您的呼叫,以跟踪是否符合公司政策或法规要求。根据您的指定标准(例如单词/短语或对话特征),构建和训练您自己的自定义分类。例如,您可以设置类别标签,以了解与追加销售或账户取消相关的呼叫各占多少百分比。

生成详细的呼叫转录

允许您的座席访问过去互动中的对话详情。逐条转录可提供诸如客户情绪、检测到的问题和中断等见解。

保护敏感的客户数据

对话通常包含敏感的客户数据,例如姓名、地址、信用卡号码和社会保险号码。Transcribe 通话分析功能可帮助您从音频和文本中识别和编辑这些信息。

联系中心集成

Genesys Cloud CX
Genesys Cloud CX 是一种云联系中心解决方案,可通过电话、文本和聊天等多种渠道统一客户和座席体验。您可以将通话音频从 Genesys Cloud 环境传输到 Amazon Transcribe,以提高座席的工作效率并提取客户互动见解。有关更多信息,请参阅 Genesys Cloud AudioHook 集成。 此外,开始使用 AWS 实时通话分析解决方案分析 yourGenesys Cloud 通话。

Amazon Chime SDK
Amazon Chime SDK 是一组实时通信组件,开发人员可以使用这些组件快速为自己的 Web 或移动应用程序添加音频通话、视频通话和屏幕共享功能。 

Amazon Chime Voice Connector
借助 Amazon Chime Voice Connector,您可以轻松地与基于 SIP 的联络中心集成,使用 Amazon Transcribe 生成用户归因的实时转录。有关更多信息,请参阅 Amazon Chime Voice Connector 文档

Amazon Transcribe Medical

医学专业

使用符合 HIPAA 标准的自动语音识别(ASR)服务 Transcribe Medical 轻松转录您的医疗对话。

口述模式

准确转录医疗口述应用场景中常见的单扬声器音频。了解详情 »

对话模式

准确转录由临床医生和/或患者组成的多扬声器对话音频。了解详情 »

Amazon Transcribe Medical

跨不同医学专业将语音转录为文本。了解详情 »

批处理 API

以高并发性大规模转录录制的医疗音频文件。了解详情 »

流式 API

通过 WebSocket 安全协议或 HTTP/2 协议近乎实时地转录音频流。了解详情 »

自定义词汇表

使用自定义词汇表来表示可能在辞典外的术语,从而提高转录准确性。了解详情 »

声道识别

同时转录多声道音频,无需额外付费。获取最终的条理清晰的转录。了解详情 »

说话人识别

在任何单声道音频中将来自不同说话人的语音分开。了解详情 »

了解有关产品定价的更多信息

访问 Amazon Transcribe 定价页面。

了解详情 
注册免费账户

立即享受 AWS Free Tier。 

注册 
开始在控制台中构建

在 AWS 管理控制台中,使用 Amazon Transcribe 开始构建。

登录