亚马逊AWS官方博客
Tag: ASR
在 Amazon SageMaker 上微调与部署语音分离模型
在这篇blog中,我们将以DPRNNTasNet为例探索开源代码迁移到SageMaker的过程与SageMaker优势,如算法一键训练,模型一键部署,自定义运行环境,过程监控等。DPRNNTasNet是 2020 ICASSP 语音分离SOTA(state of the art)模型。
使用 Amazon Transcribe 为视频增加中文字幕
Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使开发人员能够轻松地为其应用程序添加语音转文本功能。自从在 re:Invent 2017 发布以来,越来越多的用户将语音识别功能添加到其应用程序和设备中。
Transcribe计划于2019年9月在中国的北京区域(BJS)和宁夏区域(ZHY)支持该项服务。在本文中,作者分享一个使用Amazon Transcribe为视频自动增加字幕的示例。