发布于: Nov 16, 2023

Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松地为应用程序添加语音转文本功能。今天,我们很高兴地宣布推出对多语言流执行自动语言识别的功能。如果您在一个拥有多种官方语言的国家/地区运行或跨多个区域运营,您的音频流可能会包含不同的语言,并且会涉及到多种语言的切换。对于此类用例,您可以启用多语言识别,以识别您的流中使用的所有语言,并使用每种识别的语言创建转录文字。这意味着,如果发言者在对话过程中更改语言,或者如果每位参与者的语言各不相同,您的转录输出会正确检测并转录每种语言。

直播转录在各个行业广泛用于联系中心应用程序、广播活动、会议字幕以及在线学习。对于时长最短为 3 秒的音频,Transcribe 可以高效地以音频所用语言生成转录,而无需人工指定语言。

目前支持流式转录的所有 14 种语言均支持多语言音频的自动语言识别,而无需额外费用,并在以下 AWS 区域推出:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(孟买)、亚太地区(新加坡)、亚太地区(首尔)、亚太地区(悉尼)、亚太地区(东京)、非洲(开普敦)、加拿大(中部)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、南美洲(圣保罗)和 AWS GovCloud(美国西部)。您可以通过查阅 Amazon Transcribe 文档页面了解更多信息,或访问 AWS 管理控制台进行试用。

2023/11/21 - 这篇文章已更新,以反映正确的 AWS GovCloud(美国)区域(美国西部)。