发布于: Nov 26, 2023

今天,我们很高兴地宣布,Amazon Transcribe 推出由数十亿参数语音基础模型驱动的下一代系统,将自动语音识别 (ASR) 范围扩展到 100 多种语言Amazon Transcribe 是一项完全托管的 ASR 服务,让客户能够向其应用程序轻松添加语音转文本功能。我们的语音基础模型使用一流的自监督算法进行训练,可以学习各种语言和口音的人类语音固有普遍模式。

随着生成式人工智能的出现,成千上万的企业在使用 Amazon Transcribe 从其音频内容中解锁丰富的见解,并提高其音频和视频内容的可访问性和可发现性。例如,联络中心可以转录和分析客户来电以便获得见解,进而改善客户体验并提高座席的工作效率。内容制作者和媒体平台可以使用 Amazon Transcribe 自动生成字幕,以提高内容的可访问性。

以批处理模式使用 Amazon Transcribe 的所有现有客户和新客户都可以实现 100 多种语言的准确性改进,而无需对 API 端点或输入参数进行任何更改。这些新语言现已在以下 AWS 区域推出:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(北加利福尼亚)、美国西部(俄勒冈州)、亚太地区(香港)、亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)、加拿大(中部)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、欧洲地区(巴黎)、欧洲地区(斯德哥尔摩)、中东(巴林)和南美洲(圣保罗)。要开始使用,请转至服务控制台按照 10 分钟教程创建音频转录。要了解更多信息,请参阅博客文章文档