发布于: May 11, 2021

我们隆重宣布,Amazon Transcribe 现在支持部分结果稳定度,进一步改善了现场字幕体验。Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松地为应用程序添加语音转文本功能。Amazon Transcribe 处理流音频内容时,会产生部分转录结果,直到为连续语音段提供最终转录。然而,这些部分结果中的一些单词或短语可能会随着 Transcribe 对音频上下文的进一步理解而改变。部分结果稳定度通过定义转录过程中转录内容的变化量,使观看者更容易阅读文本输出。 

现在,您可以控制部分结果的稳定程度,而不必等待整个句子转录。Transcribe 提供有 3 种设置:高、中、低。稳定度设置为“高”将使得大部分的部分结果固定,只有最后几个单词在转录过程中会发生变化。这使您能够将转录结果以较小片段呈现给观看者,在屏幕上一次不超过两行字幕。此外,部分结果稳定度改善了用户体验并减少了延迟。 

部分结果稳定度可以改善视频广播和游戏内聊天的直播字幕体验。例如,媒体客户可以使用 Transcribe,使直播体育赛事可以实现实时字幕,并可以使用部分结果稳定度降低延迟。视频游戏公司也可以使用流式转录帮助有听力障碍的玩家,改善游戏内无障碍聊天。呼叫中心可以使用这种流式转录功能实时转录呼叫,以便坐席触发下一个最佳操作。 

部分结果稳定度现在可以用于提供 Amazon Transcribe 的所有 AWS 区域的流媒体音频。 首先,请阅读“使用 Amazon Transcribe 部分结果稳定度改善流式转录体验”的帖子,并在 Amazon Transcribe 服务控制台上试用。有关更多信息,请访问 Amazon Transcribe 部分结果稳定度文档。