发布于: Nov 21, 2017

Amazon Rekognition 今天增加了三项新功能:检测和识别图像中的文本;在数千万张人脸中实时进行人脸识别;以及在非常有难度的众多相片中检测出多达 100 张人脸。对于已使用 Amazon Rekognition 进行人脸验证和识别的客户来说,在大多数情况下,准确度可以提高多达 10%。 

图像文本识别:使用 Amazon Rekognition 检测图像中物体和人脸的客户一直要求我们识别图像中嵌入的文本,例如交通摄像头拍摄的路牌和车牌;电视屏幕上的新闻和字幕;或手机拍摄的家庭照片上叠加的风格化文字。从今天开始,您可以使用 Rekognition 图像文本识别功能来识别和提取图像中的文本内容。图像文本识别功能专门用于处理真实世界的图像,而不是文档图像。它支持大多数拉丁语书写体文本以及数字,这些文本和数字会嵌入在各种布局中,采用不同的字体和样式,以及在各个方向上作为横幅和海报覆盖在背景对象上。

例如,在图像共享和社交媒体应用程序中,您现在可以根据包含相同关键字的图像的索引启用视觉搜索。在媒体和娱乐应用程序中,您可以根据屏幕上的相关文本 (如广告、新闻、体育比分和字幕) 对视频进行分类。此外,在安全和安保应用程序中,您可以根据街头摄像机拍摄的图像识别车牌号。

“作为一个视觉驱动型平台,Pinterest 在很大程度上依赖于图像的速度和质量,但这些图像背后的文本同样重要,因为它提供了上下文,并使得‘图钉’能够对我们超过 2 亿个活跃用户做出有效的行动。利用 Amazon Rekognition 的图像文本识别功能,我们可以更好地针对存储在 Amazon S3 中的数百万个“图钉”,大规模地提取图像中捕获的丰富文本信息,并且延迟很低。我们期待继续发展与 AWS 的合作伙伴关系,为 Pinterest 用户以及我们的业务提供高质量、快速的体验。”- Pinterest 首席执行官 Vanja Josifovski

“专业摄影师经常使用 SmugMug 分享和出售包含文字的照片,例如马拉松比赛号码布上的数字。借助 Amazon Rekognition 的图像文本识别功能,我们能够大规模地提取号码布上的数字,并向活动摄影师提供更多功能,让他们能够快速轻松地分享和出售这些活动的照片。”- SmugMug 联合创始人、首席执行官兼首席技客 Don MacAskill
 

人脸搜索和检测:借助 Amazon Rekognition,您现在可以在包含数千万张人脸的集合中执行实时人脸搜索。这可以使搜索延迟缩短到原来的 1/10 到 1/5,并且可同时对存储比以前多 10 到 20 倍人脸的集合执行搜索。

在安全和安保应用程序中,您现在可以近乎实时地在数百万张人脸的集合中识别出所关注的人员,从而实现及时准确地预防犯罪等用例。华盛顿县警长办公室是俄勒冈州公民拨打 911 电话时的主要一线响应人员。该办公室还为全县其他市警察部门提供预防犯罪支持。之前,警长办公室曾经使用 Amazon Rekognition 将嫌疑人的识别时间从 2 到 3 天缩短到几分钟。

“这些改进使得现场警官能够在搜索时近乎实时地接收到响应。这使他们能够获得所需的信息并迅速采取行动。在现场节省几秒时间,在拯救生命方面就会多一份希望。”华盛顿县警长办公室高级信息系统分析师 Chris Adzima 说道。

从今天开始,客户还可以在单张图像中检测、分析和索引多达 100 张人脸 (从 15 张人脸开始)。通过这种改进,您可以准确地收集人口统计信息,并分析群体照片、拥挤的活动和公共场所 (如机场和百货商店) 中所有人脸的情绪。
 

要开始使用图像文本识别、人脸搜索和人脸检测功能,请下载最新的开发工具包,或者只需登录 Amazon Rekognition 控制台,即可使用提供的示例图像或您自己的图像试用此功能。有关更多信息,请参阅 Amazon Rekognition 文档来了解图像文本识别、人脸检测和人脸搜索。