发布于: Aug 20, 2020

Amazon Transcribe 现在支持在流式转录中添加讲话者标签。Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松实现语音转文本功能。在实时音频转录中,每个音频流中可能包含多个讲话者。现在,您可以方便地开启讲话者标签功能,从而帮助在输出转录中识别什么人在说什么。

Amazon Transcribe 可以在同一个实时音频流中为 2 到 10 个讲话者添加标签。适合利用讲话者标签的常见使用案例包括实时联络中心电话呼叫、音频、实时媒体广播,甚至是远程医疗会话中的医患交互。

流式音频讲话者加标签功能现已在提供 Amazon Transcribe 的所有 AWS 区域免费开放。要开始使用此功能,请进入 Amazon Transcribe 服务控制台,或者参考 Amazon Transcribe 文档页面