发布于: Sep 17, 2020
Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松地为应用程序添加语音转文本功能。Amazon Transcribe 现在扩展了对声道识别的支持,以对音频转录进行流传输。使用声道识别功能,您可以处理来自多个声道的实时音频,并使用声道标签生成单个对话转录。
在联络中心,应用程序通常设计为在单个实时呼叫期间分析发起人和代理音频声道的内容。使用声道识别,客户现在可以从一个实时音频流内分离多个声道,以生成标记每个音频声道的转录。在媒体和娱乐领域,生成具有多声道音频的内容也很常见。例如,一场在线直播脱口秀可能会有一位主持人和一位嘉宾对着不同的麦克风讲话。两个音频声道会合并到一个音频流中,以进行实时广播。使用声道识别功能,用户可以分别实时地转录主持人和嘉宾的声道,以生成实时字幕。