发布于: Feb 17, 2020

Amazon Rekognition 是一种基于深度学习的图像和视频分析服务,可以识别物体、人物、文本和场景,并通过检测不适宜的元素对内容进行审核。从今天开始,您可以检测视频中的文本,并重新获得检测置信度、位置边界框以及每次文本检测的时间戳。此外,现在您可以通过图像和视频中的文本检测功能,便捷地按感兴趣的区域 (ROI)、文字边界框大小和文字置信度评分筛选文字。 

视频中的文本检测功能可在多种场景下使用,尤其是媒体和娱乐应用。首先,您可以搜索屏幕上显示特定关键字的视频或视频时间戳,例如“突发新闻”。其次,为了实现内容的国际化,您可以快速找到节目视频时间轴上的所有文本实例,以便将其替换为其他语言的文本。第三,为了满足合规性和适度使用要求,您可以对照黑名单文字和短语字典检查文字,以此检测是否存在意外文本,例如包含亵渎和仇恨性言论的刻录字幕或标志文本。最后,您可以使用边界框位置来研究文本大小和位置对营销活动效果的营销,或者正确放置其他图片元素。 

通过按文本区域、大小和置信度评分进行筛选,您可以更加灵活地控制文本检测输出。通过使用 ROI,您可以轻松将文本检测范围限制为与您相关的区域,例如,屏幕上图片的倒数第三行区域或者用于显示足球比赛记分板的左上角。文字边界框大小筛选器可用于避免嘈杂或不相关的小背景文本。最后,通过文字置信度筛选器,您可以移除因模糊或脏污导致的不可靠的结果。 

视频文本检测和文本筛选功能现已在 Amazon Rekognition 支持的所有 AWS 区域中推出。要开始使用,您可以下载最新的 AWS 开发工具包 并参考我们的文档,以获取更多详细信息。