AWS Elemental Inference 现已支持智能字幕,实现自动化实时字幕生成

发布于: 2026年5月27日

AWS Elemental Inference 现已支持智能字幕,这是一项由 AI 驱动的新功能,能够为实时视频流自动生成字幕。智能字幕利用高级语音识别技术来转录口语音频,并以低延迟提供定时文本标记语言(TTML)格式的字幕,帮助广播公司和主播向观众提供无障碍内容,而无需手动添加字幕或使用第三方服务。

借助智能字幕,您可以为广播中的英语(美国、英国和澳大利亚)、法语、德语、意大利语、葡萄牙语和西班牙语内容添加实时字幕,只需通过与 AWS Elemental MediaLive 的原生集成启用该功能即可。您可以通过 AWS Elemental Inference API 或控制台创建自定义词典,从而提高对专业内容(例如包含运动员姓名的体育解说或技术术语)的转录准确性。智能字幕可与现有的 Elemental Inference 功能(例如用于竖屏视频的智能裁剪和剪辑生成)协同工作,并且您将获享相同的非线性定价模式,当对同一内容同时使用多项功能时,每项功能的成本会随之降低。

要了解更多信息,请参阅 AWS Elemental Inference 文档MediaLive 文档AWS Elemental Inference 定价页面

AWS Elemental Inference 智能字幕已在以下 AWS 区域推出:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(孟买)和欧洲地区(爱尔兰)。