AWS Elemental Inference 现已支持智能字幕，实现自动化实时字幕生成

发布于: 2026年5月27日

AWS Elemental Inference 现已支持智能字幕，这是一项由 AI 驱动的新功能，能够为实时视频流自动生成字幕。智能字幕利用高级语音识别技术来转录口语音频，并以低延迟提供定时文本标记语言（TTML）格式的字幕，帮助广播公司和主播向观众提供无障碍内容，而无需手动添加字幕或使用第三方服务。

借助智能字幕，您可以为广播中的英语（美国、英国和澳大利亚）、法语、德语、意大利语、葡萄牙语和西班牙语内容添加实时字幕，只需通过与 AWS Elemental MediaLive 的原生集成启用该功能即可。您可以通过 AWS Elemental Inference API 或控制台创建自定义词典，从而提高对专业内容（例如包含运动员姓名的体育解说或技术术语）的转录准确性。智能字幕可与现有的 Elemental Inference 功能（例如用于竖屏视频的智能裁剪和剪辑生成）协同工作，并且您将获享相同的非线性定价模式，当对同一内容同时使用多项功能时，每项功能的成本会随之降低。

要了解更多信息，请参阅 AWS Elemental Inference 文档、MediaLive 文档和 AWS Elemental Inference 定价页面。

AWS Elemental Inference 智能字幕已在以下 AWS 区域推出：美国东部（弗吉尼亚州北部）、美国西部（俄勒冈州）、亚太地区（孟买）和欧洲地区（爱尔兰）。

AWS Elemental Inference 现已支持智能字幕，实现自动化实时字幕生成

了解

资源

开发人员

帮助