发布于: Nov 2, 2018
Amazon Rekognition 是一种基于深度学习的图像和视频分析服务,可以识别物体、人物、文字、场景和活动,以及检测任何不适宜的内容。今天,我们宣布推出对象和场景检测功能的一项重大更新,也称为“标签检测”。标签检测可以识别出图像中的对象和场景。到目前为止,Amazon Rekognition 可以识别图像中是否存在对象,但无法找到对象在图像中的位置。Amazon Rekognition 现在可以通过返回对象边界框来指明图像中常见对象(如狗、人和汽车)的位置,并且可以显著提高各种用例中所有现有对象和场景标签的准确性。此外,客户可以使用边界框信息来推断图像中出现的每个对象的数量(“3 只狗”)以及对象之间的关系(“沙发上的狗”)。这些新的增强功能均无需额外费用。
新闻、体育和社交媒体公司的客户都面临着图像库中的内容会快速增加这一问题。他们正在寻找快速搜索和筛选此类内容的方法。人工提供的元数据在某种程度上适用于此类应用程序,但该方法的准确性和可扩展性有限。借助 Amazon Rekognition 的对象和场景检测功能,客户可以自动为巨大的图像库编制索引,使其可供搜索。
“GuruShots 将全世界数百万摄影爱好者联系在一起并为他们提供灵感,它改变了人们与其照片交互的方式,为他们提供了更有趣、更令人兴奋和满意的体验。以前,我们的最终用户需要手动标记图像以获得更好的见解。为了提供更好的客户体验,我们一直在寻找可自动标记已上传图像的可扩展方法,以便进行进一步分析。使用 Amazon Rekognition,我们现在可以标记每个用户上传的图像,并使用生成的元数据来发现趋势、改进搜索结果,并根据用户偏好调整内容。这一新的简化流程使用户保留率提高了 40%,互动度提高了 50%。”- Eran Hazout,GuruShots 创始人兼首席技术官
现在,使用对象边界框,客户可以计算图像中出现的每个对象的数量(“3 只狗”),并且还可以通过使用相对于图像尺寸的位置坐标和边界框大小来确定哪些对象相较于其他对象比较显眼或重要。此信息可用于确定用户偏好。例如,有大量突出显示“汽车”的照片的人可能是汽车爱好者。一些客户还使用边界框来进一步处理图像,例如对某些对象进行模糊处理,如武器。边界框信息可以进一步用于搜索特定类型的图像(显示多只狗的图像或突出显示狗的图像与背景中的一只狗)。为了使资产搜索功能更加强大,Amazon Rekognition 现在可以在分层列表中返回父标签,例如,标签“狗”具有“哺乳动物”、“犬科”和“动物”这几个父标签。这些元数据让客户能够按父子关系对相关标签进行分组,以改进分类和筛选结果。
目前,提供 Amazon Rekognition Image 的所有区域均推出了边界框、分层元数据和更高的标签检测准确性。Amazon Rekognition Video 的标签改进功能即将推出。您可以通过 Rekognition 控制台或下载最新的 AWS 开发工具包立即开始使用。有关更多信息,请参阅相关文档。