亚马逊AWS官方博客
利用 Amazon Transcribe Call Analytics 从客户对话中提取见解
2017 年,我们推出了 Amazon Transcribe,这是一项自动语音识别 (ASR) 服务,用于轻松地为任何应用程序添加语音转文本功能。今天,我非常高兴地宣布推出 Amazon Transcribe Call Analytics,这一全新功能可让您通过一次 API 调用轻松从客户对话中提取宝贵的见解。
每次与潜在客户或现有客户展开的讨论都是了解其需求和期望的绝佳机会。例如,客户服务团队必须找出客户致电的主要原因,并衡量这些通话期间的客户满意度。同样,销售人员尝试衡量客户的兴趣所在及其对特定销售宣传言辞的反应。
因此,许多客户和合作伙伴都希望在不同的应用程序中加入呼叫分析功能,并且无需考虑采用的联系中心提供商。他们通常需要分析的不仅仅是电话,还包括基于 Web 的音频和视频通话 (举例而言)。到目前为止,他们通常整合 AI 服务和专用机器学习模型来实现这一目标,因此他们要求我们提供更简单的解决方案。
我们响应要求并构建了 Amazon Transcribe Call Analytics,这一加入 Transcribe 的全新功能是 AWS 联系中心智能的重要增强。如果您迫不及待地想要试用此功能,请立即跳转到 AWS 控制台。如果您想了解更多信息,请继续阅读!
Amazon Transcribe 呼叫分析简介
基于 Transcribe 中实施的 ASR,Transcribe Call Analytics 加了专门针对客户呼叫进行训练的自然语言处理 (NLP) 功能,同时进行了优化,以提供高度准确的呼叫转录和可指导行动的见解。通过简单的 API 调用,开发人员现在可以轻松地将呼叫分析功能加入任何应用程序,并从对话中提取客户见解,而无需构建 AI 管道和训练自定义机器学习模型。
Transcribe Call Analytics 的主要功能包括:
- 带时间戳的按轮次呼叫转录 (以 21 种语言)。
- 问题检测,这会在对话轮次中选择最短的连续单词集,其代表了客户致电的原因。无需进行任何配置或培训即可立即使用此功能。
- 基于对话特征的呼叫分类:
- 匹配特定的单词和短语,
- 检测非通话时间,
- 检测中断,
- 分析客户和接线员的情绪。
- 呼叫特征,例如:
- 客户或接线员说话的速度和声调,
- 检测非通话时间,
- 检测中断。
- 根据文本转录和相应的音频文件中对敏感数据进行密文标记。
例如,您可以创建规则来标记如下呼叫:客户打断接线员的说话,表现出负面情绪,并且说道:“我想与经理对话”。这些呼叫必然是进展不顺利,值得详细分析! 您也可以寻找如下呼叫:接线员在前 15 秒内未使用预定义问候语(“欢迎致电 ACME 支持中心,今天有什么可以帮您的吗?”),借此衡量呼叫脚本合规性并帮助主管确认是否应指导接线员。另一种常见的场景是创建规则来标记提及特定产品和服务的对话内容 (“您的 ACME Turbo 2000 真空吸尘器未按预期发挥作用”),以便掌握需要注意的任何新趋势。
最后但并非最不重要的是,您可以使用其他 AI 服务 (如 Amazon Translate) 或以 Amazon SageMaker 构建的自定义 NLP 模型进一步处理文本转录。
现在,我们来做一个快速演示。
使用 Amazon Transcribe Call Analytics 提取见解
这是一通虚构的支持呼叫,其中一位女士致电银行,报告自己的信用卡和借记卡丢失。声音文件是立体声 WAV 文件 (16 位,8kHz)。
Transcribe Call Analytics 要求在各自的声道中录制接线员和客户的对话内容。我们还需要区分哪个是接线员声道。在立体声文件中,左声道通常是第一个声道 (声道 #0),右声道则是第二个声道 (声道 #1)。对于此呼叫,情况即是如此。
如果您不确定具体的声道,可以使用多功能的 ffmpeg
开源工具轻松地将每个声道提取到单独的音频文件中。
$ ffmpeg -i demo-call.wav -map_channel 0.0.0 channel0.wav -map_channel 0.0.1 channel1.wav
您可以使用同样的技术从其他文件类型 (例如视频文件) 中提取音频声道,然后将它们重新组合到立体声音频文件中。可以在 ffmpeg
文档中找到更多相关信息。
现在已确定接线员位于声道 #1 中,因此可以使用 AWS CLI 将音频文件上传到 S3 存储桶。
$ aws s3 cp launch-call.wav s3://jsimon-transcribe-useast1/demo-call.wav --region us-east-1
打开 Transcribe Call Analytics 控制台,从中可以看到各种可用的呼叫类别模板。
我决定创建一个类别以供主管上报。然后,通过几次单击,我就创建了一个名为 welcome-message
的自定义呼叫类别,以检查接线员是否以适当的欢迎词开始通话。如果需要,我可以添加几个短语进行检查。我们建议您使用短句来尽量减少弹出填充词的可能性 (“嗯”、“呃”等)。
然后,我使用 Transcribe 中提供的一般模型创建一个呼叫分析任务。我同时启用了自动语言检测功能。
接下来,我定义 S3 中音频文件的位置,将声道 #1 标记为接线员声道。
我决定将转录内容存储在我账户中 Transcribe 创建的默认 S3 存储桶内。如果需要,我也可以使用自己的存储桶。然后,我选择一个具备足够权限的 AWS Identity and Access Management (IAM) 角色,然后启动该任务。
大约一分钟后,任务即告完成。控制台包含文本转录的预览以及指向完整 JSON 转录内容的链接。
由于接线员在前 15 秒钟内使用了正确的欢迎语句,因此以之前创建的类别标记此呼叫。
下载 JSON 转录后,对话中的每条语句都会附上表示每个单词响度的元数据,该元数据的值范围为 0-100,100 表示非常响亮。以下是第一句话:
"BeginOffsetMillis":440,"EndOffsetMillis":4960,
"情绪":"NEUTRAL",
"ParticipantRole":"接线员",
"LoudnessScores":[78.68,80.4,81.91,78.95,82.34],
"内容":"您好,感谢您致电本行。我是 Ashley,今天有什么可以帮您的吗?"
通过查看下一句话,我发现 Transcribe Call Analytics 自动检测到客户的问题。相应的文本以粗体显示:
"内容": "你好,我需要取消我的卡片。我有一张借记卡和一张信用卡。",
"IssuesDetected":
[
{
"UnredactedCharacterOffsets":
{
"Begin": 26,
"End": 40
}}. . .
在转录内容的末尾,我看到了全局呼叫统计数据 (持续时间、通话时间、每分钟单词数、匹配的类别)。Transcribe 还为我提供了总体情绪信息,衡量范围从 -5 (非常负面) 到 +5 (非常正面)。我还得到了四个季度内的详细数据。
"情绪":{"OverallSentiment":{"接线员":2.6,"客户":0.2},
"SentimentByPeriod":{"季度":
{"接线员":[
{"分数":1.9,"BeginOffsetMillis":0,"EndOffsetMillis":68457},
{"分数":-0.7,"BeginOffsetMillis":68457,"EndOffsetMillis":136915},
{"分数":5.0,"BeginOffsetMillis":136915,"EndOffsetMillis":205372},
{"分数":3.0,"BeginOffsetMillis":205372,"EndOffsetMillis":273830}],
"客户":[
{"分数":-1.7,"BeginOffsetMillis":0,"EndOffsetMillis":68165},
{"分数":0.0,"BeginOffsetMillis":68165,"EndOffsetMillis":136330},
{"分数":0.0,"BeginOffsetMillis":136330,"EndOffsetMillis":204495},
{"分数":2.1,"BeginOffsetMillis":204495,"EndOffsetMillis":272660}]}}}
可以看到,客户带着负面情绪开始通话,然后迅速变为中立情绪,并以正面的情绪结束通话。这是不错的迹象,表明此次通话得到了令人满意的处理,客户问题已经解决。
如果想要将转录内容转换为带有额外可视化效果的 Word 文档,我的同事 Andrew Kan 构建了一个不错的工具并在 Github 上提供。以下是其工具生成的一份示例报告。
AWS 客户和合作伙伴正在使用 Amazon Transcribe Call Analytics
Talkdesk 高级副总裁兼产品与工程、人工智能、自动化和劳动力全球负责人 Ben Rigby 告诉我们:“我们的客户每年在联系中心处理数百万个客户服务电话,并且迫切需要提取可指导行动的对话见解,以确保取得积极的业务成果。作为 AWS 联系中心智能合作伙伴,我们通过 Amazon Transcribe 进一步增强呼叫转录功能。随着 Amazon Transcribe Call Analytics 的推出,我们很高兴能够为我们的语音分析和 QM Assist 产品融入更多 AI 功能。这些更深入的见解可以为接线员和主管提供所需的数据,以提升客户服务的速度和质量,同时提高员工生产力。”
SuccessKPI 首席产品官 Paphul Kumar 补充说道:“Amazon Transcribe Call Analytics API 可让我们以更快的速度、更低的成本向平台添加基于机器学习的功能。借助这一全新的 API,我们不再需要将多个 AI 服务集成在一起,以及在某些领域开发自定义机器学习模型。借助 Transcribe Call Analytics,我们将能够提供对话见解,例如情绪、非通话时间和呼叫类别,以此衡量接线员的表现。这有助于推动更好的呼叫结果,减少接线员流动率,揭示指导接线员的需求以及衡量呼叫脚本合规性。我们未经任何考虑就将 AWS 服务结合到 SuccessKPI 的体验分析平台中。我们期待着把这一极具价值的能力带给大型企业和政府机构。”
开始使用
执行单次 API 调用就可从客户对话中提取丰富的见解。您可以立即在以下区域开始使用 Amazon Transcribe Call Analytics:
- 美国西部 (俄勒冈)、美国东部 (弗吉尼亚北部)、
- 加拿大 (中部)、
- 欧洲 (伦敦)、欧洲 (法兰克福)、
- 亚太地区 (孟买)、亚太地区 (新加坡)、亚太地区 (首尔)、亚太地区 (东京)、亚太地区 (悉尼)。
请在 AWS 控制台中尝试此新功能,然后告诉我们您的想法。我们如往常一样期待您的反馈! 您可以通过您的常用 AWS Support 联系人发送反馈或者将反馈发布到面向 Amazon Transcribe 的 AWS 论坛。
最后一件事:如果您正在寻求易于使用的全渠道云联系中心,请务必了解 Amazon Connect 及其机器学习支持的分析 Contact Lens。