发布于: Aug 20, 2020
Amazon Transcribe 现在支持在流式转录中添加讲话者标签。Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松实现语音转文本功能。在实时音频转录中,每个音频流中可能包含多个讲话者。现在,您可以方便地开启讲话者标签功能,从而帮助在输出转录中识别什么人在说什么。
Amazon Transcribe 可以在同一个实时音频流中为 2 到 10 个讲话者添加标签。适合利用讲话者标签的常见使用案例包括实时联络中心电话呼叫、音频、实时媒体广播,甚至是远程医疗会话中的医患交互。