发布于: Jul 17, 2018

Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松地为应用程序添加语音转文本功能。您可以使用 Amazon Transcribe 来创建音频和视频文件的文本转录。即将推出的 Amazon Transcribe 将支持一种叫做声道合成的功能,每个讲话人的声音都录制在不同的声道中,从而更好地处理音频。例如,调查员的立体声音轨存储在左声道中,而受访者的音轨存储在右声道中。

声道合成功能将令联络中心在誊录多声道客户电话录音时显著受益。通常情况下,代理和来电者的声音将在不同的声道里录制,然后再合并到一个音频文件中。例如,Amazon Connect 等联络中心应用程序会分别存储代理和客户的立体音频声道。代理音频存储在右声道中,最终客户等所有来电音频则存储在左声道中。联络中心可以将单个音频文件提交到 Amazon Transcribe,后者会识别并分解出两个声道,誊录每个声道的讲话内容,然后使用声道标签制作协调的合并脚本。借助声道标签,联络中心现在能够以更高的准确性和效率,更好地识别和分析每个讲话人都说了什么。此外,客户不再需要将每个声道的录音作为单独的音频文件提交以供誊录,从而减少了联络中心的总体成本和工作负载。