Category: Amazon Rekognition*


Amazon Rekognition 推出实时面部识别、图像文本识别功能支持以及改进的面部检测功能

Amazon Rekognition 今天推出了三项新功能:用于检测和识别图像中的文本的功能、用于从数千万个面部中实时识别面部的功能以及用于从一堆照片中检测出最多 100 个面部的功能。在大多数情况下,客户通过使用 Amazon Rekognition 进行面部验证和识别可将准确度提高最多 10%。

图像文本识别

使用 Amazon Rekognition 检测图像中的对象和面部的客户一直要求我们提供用于识别图像中嵌入的文本的功能。此文本的示例包括路标、交通摄像头捕获到的牌照、新闻、电视屏幕上的字幕以及手机捕获的家庭照片上覆盖的程式化引述。从今天开始,您可以使用 Rekognition 图像文本识别功能来识别和提取图像中的文本内容。图像文本识别功能专用于处理真实图像,而不是文档图像。它支持大多数拉丁文脚本中的文本以及各种布局、字体和样式中嵌入的数字。它还支持识别不同方向的背景对象 (如横幅和海报) 上覆盖的文本。

“作为一个视觉驱动型平台,Pinterest 在很大程度上依赖于图像的速度和质量,但这些图像背后的文本同样重要,因为它提供了上下文,并使我们 2 亿个以上的活跃用户能够操作书签。利用 Amazon Rekognition 的图像文本识别功能,我们可以更好地针对存储在 Amazon S3 中的数百万个“书签”,大规模地提取图像中捕获的丰富文本信息,并且延迟很低。我们期待继续与 AWS 合作,为书签用户提供优质而快速的体验并拓展我们的 Pinterest 业务。”– Vanja Josifovski,Pinterest 首席技术官

“专业摄影师经常使用 SmugMug 分享和售卖包含文字的照片,例如马拉松比赛号码布上的数字。借助 Amazon Rekognition 的图像文本识别功能,我们能够大规模地提取号码布上的数字,并向活动摄影师提供更多功能,使他们能够快速轻松地分享和售卖这些活动的照片。”– Don MacAskill,SmugMug 联合创始人、首席执行官兼首席技客

实时面部识别

您现在可对包含数千万个面部的集合执行实时面部搜索。这可将搜索延迟缩短 1/10 到 1/5,同时可对存储的面部数量比以前多 10 到 20 倍的集合执行搜索。对于安全和公共安全应用,此更新可帮助在包含数百万个面部的集合中实时识别出相关人员,从而支持需要立即响应的使用案例。

华盛顿县警察局是俄勒冈州市民拨打 911 电话时的首要响应方。该警察局还为全县其他城市警察部门提供预防犯罪的支持。在过去的一年里,该警察局一直在使用 Amazon Rekognition,将报告嫌疑犯的识别时间从 2-3 天缩短至几分钟,并且利用他们的新系统在第一周内就逮捕了第一个嫌疑犯。

“这些改进使得现场警官能够近乎实时地接收到对搜索的响应。这使他们能够获得所需的信息并迅速采取行动。在现场节约几秒钟时间对于挽救生命非常重要。”– Chris Adzima,华盛顿县警察局的高级信息系统分析师。

人群模式面部检测

从今天开始,客户还可以在单张图像中检测多达 100 个面部 (15 个起),并对这些面部进行分析和编制索引。通过这种改进,您可以准确地捕获到人口统计信息,并分析群体照片、人群拥挤的活动和公共场所 (如机场和百货商店) 中所有面部的情绪。

“我们的大量照片都是用户以前购买或上传到我们的平台上的。我们通常需要在这些集合中搜索特定用户的孩子的照片,并且我们一直使用 Amazon Rekognition 执行此操作。由于我们有许多组包含几十个小脸的照片,因此,我们之前不得不裁切并分割原始图像以正确检测所有面部。通过使用新的人群面部检测功能,现在我们可以轻松检测出所有面部,而无需预先进行复杂的处理。– Shinji Miyazato,Sen Corporation 的工程部 SRE 主管。

提高了面部检测模型的准确度

我们还提高了面部检测算法的准确度,这使得检票柜台和员工转门处以及基于面部的手机身份验证中使用的面部验证和识别应用程序的准确度提高了 10%。

最让我们兴奋的是来自多个垂直行业的客户对大型图像分析工作负载的生产推广。我们的客户群不断壮大,其中值得一提的一些新客户包括:

Butterfleye,一家面向家庭和小型商场的安全摄像头的供应商,该公司使用 Amazon Rekognition 快速、经济高效地开发其面部和对象检测摄像头,将其开发时间从 18 个月缩短至 4 个月,并且节省了 100 万美元以上的研发费用。

Open Influence 帮助企业客户找到社交媒体影响者来推广其品牌。由于能够轻松地将 Amazon Rekognition 与其自己的数据管道集成,他们可以生成高质量的搜索结果,帮助其客户发现他们从未发现过的影响者。

Amazon Rekognition 正在帮助 Marinus Analytics 打击人口贩卖活动。美国执法机构使用其旗舰软件来调查性交易。有了 Amazon Rekognition,使用 Marinus Analytics 的调查人员可通过在几秒内搜索数百万条记录来找到受害人,并采取快速高效的行动。

了解有关 Amazon Rekognition 的更多信息。您也可以快速开始使用 Amazon Rekognition。如果您有任何疑问,请在评论中留言。


Ranju 已在 Amazon 工作将近 5 年了,他主管 Amazon Rekognition,这是一项基于深度学习的图像识别服务,可让您搜索、验证和整理数百万张图像。在加入 Amazon 之前,Ranju 就职于 Barnes and Noble,负责 Nook Cloud 工程工作。他的团队负责 Nook 移动服务和数字资源管理服务的策略、设计、开发和 SaaS 运行。

使用 Amazon Rekognition 和图形数据库来了解电影明星的社交网络

Amazon Rekognition 是一种让您能够向应用程序中轻松添加图像分析功能的 AWS 服务。由深度学习提供技术支持的此计算机视觉 API 中增加的最新功能为名人识别。这项简单易用的功能能够检测并识别出各领域数以千计的著名、值得注意或广为人知的人士。用户可以利用该工具根据任何特定兴趣对名人的数字图像库编制索引和进行搜索。

我们看到客户存储个人相关数据的一种常见方式是使用图形数据库。在之前的博文中我们曾仔细讨论过,像 Facebook、LinkedIn 和 Twitter 这样的公司已凭借其对庞大关系网络的管理能力,让整个社会的互动方式发生了彻底变革。本博文的目的就是展示将 Rekognition 的名人及人脸识别功能与图形数据库中存储的关系信息进行配对是多么简单。

这些技术的配对让客户只需要一张图片就能够知道图片中的人物与另一位相关人物的关系。用户甚至可以提交两张图片,然后快速确定这两张不同图片中的两个人之间可能存在怎样的相互关系。这种关系映射的一个有趣例子就是著名的 Kevin Bacon 六度分割游戏。然而,此类应用存在巨大商业价值。执法机构可以从两张图片入手,先使用 Rekognition 来识别当事人,然后再通过查询图形数据库来判断两名当事人是否彼此相识。同样地,酒店类公司也可以使用 Rekognition 和图形数据库来快速识别酒店内的任何名人,以及了解有哪些他们可能认识的其他名人在附近住宿。

在本博文中,我们将展示如何将 Rekognition 与图形数据库(我们将使用Neo4j 社区版)和使用 D3.js 库的 Jupyter Notebook 结合使用。

设置

要开始使用这项令人兴奋的组合技术,首先要从 AWS 实验室 Github 存储库获得一份项目副本。该项目结构主要包含两个方面:

  • <project root> – 这是实际的 Jupyter Notebook 及所有依赖项所在的位置。
  • <project root>/cft – AWS CloudFormation 模板、示例属性,以及创建基础设施的示例命令。

您将需要添加一个新的或现有的 SSH 密钥。AWS CloudFormation 模板会安装 Neo4j 社区版,下载来自 AWS 实验室的 Jupyter Notebook (其中包含用于与 Rekognition 交互的 Python 示例代码),并配置几个快速开始操作所需的其他 Amazon EC2 设置。Cloud Formation 模板还会自动下载要通过 Neo4j 浏览器或 Jupyter Notebook 对其进行查询的常用电影图形数据库

(more…)