发布于: Jun 1, 2022

Amazon Transcribe 是一项自动语音识别(ASR)服务,使您能够轻松地为应用程序添加语音转文本功能。今天,我们很高兴地宣布推出以批处理模式对多语音频执行自动语言识别的功能。如果您的录音不止包含一种语言,您便可以启用多语言识别,该功能可识别音频文件中的所有语言,并使用每种识别到的语言来创建脚本。这意味着,如果发言者在对话过程中更改语言,或者如果每位参与者的语言各不相同,您的转录输出会正确检测并转录每种语言。在此之前,Transcribe 会检测音频中的主要语言并以识别出的语言生成转录。现在,您只需提供音频文件,Transcribe 将从语音信号中检测出主要语言并生成所识别语言的转录。

如果您在一个拥有多种官方语言的国家/地区运行或跨多个区域运行,您的音频文件可能会包含不同的语言,并且会涉及到多种语言的切换。对于时长最短为 3 秒的音频,Transcribe 可以有效生成所用语言的转录,而无需人工指定所用语言。这适用于各种不同的使用案例,例如转录客户呼叫、将语音邮件转换为文本、捕获会议交互,跟踪用户论坛交流,或监控媒体内容生产和本地化工作流。

目前支持批量转录的所有 37 种语言均支持多语言音频的自动语言识别,无需额外费用。该功能现已在以下 AWS 区域推出:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈州)、非洲(开普敦)、亚太地区(香港)、亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、加拿大(中部)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、欧洲地区(巴黎)、欧洲地区(斯德哥尔摩)、中东(巴林)、南美洲(圣保罗)和 AWS GovCloud(美国西部)。您可以通过查阅 Amazon Transcribe 文档页面了解更多信息,或访问 AWS 管理控制台试用。