Amazon Rekognition 现已全面推出

免费试用 Amazon Rekognition
或登录到控制台

注册后,Amazon Rekognition 新客户在前 12 个月可享受:每月分析 5000 张图像,每月存储 1000 张面部元数据。

查看 AWS 免费套餐详细信息 »


问:什么是 Amazon Rekognition?

Amazon Rekognition 是一种采用深度学习技术的完全托管式图像识别服务。Amazon Rekognition 由 Amazon 计算机视觉团队历时多年精心打造,其每天分析的图像数量都达到了数十亿张。Amazon Rekognition 提供了易于使用的 API,能够检测数千种对象和场景、分析面部、比较两副面孔并测量相似性,以及对照面孔库核验面孔。借助 Amazon Rekognition,您可以轻松构建基于图像中的可视内容进行搜索的应用程序、分析面部属性以确定人口统计学特征、实施安全的面部验证等。Amazon Rekognition 用于大规模分析图像,并与 Amazon S3、AWS Lambda 及其他 AWS 服务无缝集成。

问:什么是深度学习?

深度学习是机器学习的一个子领域,是人工智能的重要分支之一。其目的是通过使用具有由多个线性和非线性变换组成的多个处理层的深度图来从原始数据推断高级抽象。深度学习大致上基于大脑中的信息处理和通信模型。深度学习使用从大量的注释数据中学到的特征代替人工编写的特征。其通过利用高效算法迭代估计深度图中成千上万的参数来进行学习。

卷积深度神经网络 (CNN)、递归神经网络等几种深度学习架构业已在计算机视觉、语音识别、自然语言处理和音频识别中得到了应用,以产生关于各种任务的最前沿结果。

Amazon Rekognition 是 Amazon AI 系列服务的一部分。Amazon AI 服务使用深度学习技术来理解图像、将文本转换成逼真的语音以及构建直观的会话文本和语音界面。

问:使用 Amazon Rekognition 需要具备深度学习方面的专业技能吗?

没有。借助 Amazon Rekognition,您不必构建、维护或升级深度学习管道。

为在复杂的计算机视觉任务 (如对象和场景检测、面部分析和面部识别) 方面获得准确的结果,需要对深度学习系统进行适当调整并为其提供海量带有标签的真实数据进行训练。获取、清理和准确地标记数据是一项耗时且代价高昂的任务。此外,训练深度神经网络需要付出昂贵的计算成本,并且通常需要使用图形处理单元 (GPU) 构建的自定义硬件。

Amazon Rekognition 是一种完全托管式服务,已预先进行过图像识别任务方面的训练,因此,您不必投入时间和资源创建深度学习管道。Amazon Rekognition 会继续通过融入最新的研究成果和获取新的训练数据来提高其模型的准确度。这使您能够专注于设计和开发高价值的应用程序。

问:如何开始使用 Amazon Rekognition?

如果还没有注册 Amazon Rekognition,您可以单击 Amazon Rekognition 页面上的“Try Amazon Rekognition”按钮,然后完成注册过程。您必须拥有 Amazon Web Services 账户才能访问此服务;如果还没有账户,则在注册期间,系统将提示您创建一个账户。注册后,您可以通过 Amazon Rekognition 管理控制台使用您自己的图像试用 Amazon Rekognition,或下载 Amazon Rekognition 软件开发工具包并开始创建您自己的应用程序。有关更多信息,请参阅我们的分步入门指南

问:Amazon Rekognition 提供了哪些 API?
Amazon Rekognition 提供了用于检测对象和场景、检测和分析面部、比较面部、在面部集合中搜索相似面孔的 API,以及用于管理资源的 API。有关详细信息,请参阅 Amazon Rekognition API 参考

问:Amazon Rekognition 支持哪些图像格式?

Amazon Rekognition 目前支持 JPEG 和 PNG 图像格式。您可以提交 S3 对象或字节数组形式的图像。

问:Amazon Rekognition 支持多大的图像文件?

以 S3 对象形式传递时,Amazon Rekognition 支持高达 15MB 的图像文件大小;以图像字节数组形式提交时,它支持高达 5MB 的图像大小。

问:图像分辨率对结果质量有影响吗?

Amazon Rekognition 支持各种图像分辨率。为获得最佳效果,我们建议使用 VGA (640x480) 或更高的分辨率。Amazon Rekognition 接受的最低图像分辨率为 80 x 80 像素,但低于 QVGA (320 x 240) 的图像可能会增大遗漏面孔、对象或不当内容的几率。

问:Amazon Rekognition 能够检测和分析多小的对象?

一般来说,请确保图像中存在的最小对象或面部至少占据图像较短维度 (以像素为单位) 的 5%。例如,如果您使用 1600x900 的图像,则最小的面部或对象在任一维度上应至少为 45 个像素。

问:Amazon Rekognition 在哪些 AWS 区域可用?

目前,美国东部 (弗吉尼亚北部)、美国西部 (俄勒冈)、欧洲 (爱尔兰)、AWS GovCloud (美国) 和 AWS 亚太地区 (东京) 地区都提供 Amazon Rekognition。


问:什么是标签?

标签是基于其内容在图像中找到的对象、场景或概念。例如,热带海滩上的人物照片可能包含“人物”、“水”、“沙”、“棕榈树”和“泳装”(对象)、“海滩”(场景)、“户外”(概念) 等标签。

问:什么是置信度得分,如何使用它?

置信度得分是一个介于 0 与 100 之间的数字,用于指示给定预测正确的概率。以上面的热带海滩为例,如果对象和场景检测过程对于标签“水”返回 99 的置信度分数,对于标签“棕榈树”返回 35,则说明这张图像很有可能包含水但不包含棕榈树。

对检测错误 (假阳性) 非常敏感的应用程序应丢弃置信度得分低于某一阈值的结果。最佳阈值因应用而异。在许多情况下,将最低置信度值设为高于默认值可获得最佳的用户体验。

问:什么是对象和场景检测?

对象和场景检测指的是分析图像以基于其可视内容分配标签的过程。Amazon Rekognition 通过 DetectLabels API 来完成这一操作。您可以使用此 API 自动识别数千种对象、场景和概念,并为每个标签返回置信度得分。DetectLabels 使用的默认置信度阈值为 50。对象和场景检测是需要搜索和组织大型图像库的客户的理想选择,如依赖于用户生成内容的消费者和生活方式应用、寻求改进其定位算法的广告技术公司等。

问:Amazon Rekognition 支持哪些类型的标签?

Rekognition 支持数千种属于常见类别的标签,包括但不限于:

  • 人物和事件:“婚礼”、“新娘”、“婴儿”、“生日蛋糕”、“吉他手”等
  • 食品和饮料:“苹果”、“三明治”、“葡萄酒”、“蛋糕”、“比萨饼”等
  • 自然与户外:“海滩”、“山”、“湖”、“日落”、“彩虹”等
  • 动物和宠物:“狗”、“猫”、“马”、“虎”、“海龟”等
  • 家庭和花园:“床”、“桌子”、“后院”、“枝形吊灯”、“卧室”等
  • 运动休闲:“高尔夫”、“篮球”、“曲棍球”、“网球”、“远足”等
  • 植物和花:“玫瑰”、“郁金香”、“棕榈树”、“森林”、“竹子”等
  • 艺术与娱乐:“雕塑”、“绘画”、“吉他”、“芭蕾”、“马赛克”等
  • 运输和车辆:“飞机”、“汽车”、“自行车”、“摩托车”、“卡车”等
  • 电子产品:“电脑”、“手机”、“摄像机”、“电视”、“耳机”等

问:我找不到我需要的标签。如何申请新的标签?

请通过 AWS 客户支持向我们发送您的请求。Amazon Rekognition 会根据客户反馈不断扩展其标签目录。


问:什么是图像审核?

Amazon Rekognition 的图像审核是一种基于深度学习并且易于使用的 API,用于检测图像中的明显或暗示性成人内容。开发人员可以根据自己的业务需求,使用这种额外的元数据来筛选不当内容。除了根据存在的成人内容对图像进行标记之外,图像审核功能还会返回一个带有置信度的分级标签列表。这些标签会指明成人内容的具体类型,从而让开发人员能够进行更细化的控制,以便筛选和管理大量用户生成的内容 (UGC)。这一 API 可以用于社交和交友网站、相片分享平台、博客和论坛、儿童应用程序、电子商务网站、娱乐和在线广告服务等应用场景。

问:Amazon Rekognition 可以检测哪些类型的明显或暗示性成人内容?

Amazon Rekognition 可以检测图像中以下类型的明显或暗示性成人内容:

  • 明显的裸露
    • 裸露
    • 男性裸体图形
    • 女性裸体图形
    • 性活动
    • 部分裸露
  • 暗示性
    • 女性泳装或内衣
    • 男性泳装或内衣
    • 暴露的衣服

Amazon Rekognition 的图像审核 API 可以返回一个分级标签列表,并附带检测到的每个标签的置信度。例如,对于一张不当图像,Rekognition 可能会返回最高级别的标签“明显的裸露”及其置信度。开发人员可以利用这一功能来标记内容。同时,Rekognition 还会提供“男性裸体图形”等更多信息及其置信度,从而返回细化到第二级别的信息。开发人员可以利用这一信息来构建更为复杂的筛选逻辑。

请注意,图像审核 API 并不能筛选出所有明显或暗示性成人内容。此外,图像审核 API 无法检测出某个图像是否包含违法内容(例如儿童色情内容) 或不正常成人内容。

问:除了明显和暗示性成人内容以外,Amazon Rekognition 的图像审核 API 能否检测其他不当内容?

Rekognition 目前只支持上文所述的标签。我们会根据客户反馈继续添加并完善各种标签。

如果您需要检测图片中其他类型的不当内容,请通过下文介绍的反馈流程联系我们。

问:怎样确保 Rekognition 符合我的成人图像审核案例的要求?

Rekognition 的图像审核模型已经经过调整和大规模测试,但我们不建议您用自己的数据集来测量准确性和衡量性能。

您可以在 API 请求中使用“MinConfidence”参数,以便在内容检测 (灵敏度) 和检测准确性 (精度) 之间实现平衡。如果降低“MinConfidence”,您可能会检测出大多数不当内容,但也有可能检测出事实上不属于明显或暗示性成人内容的内容。如果提高“MinConfidence”,您可能能够确保检测出的所有内容事实上都是明显或暗示性成人内容,但可能会没有标记出某些不当内容。有关如何使用“MinConfidence”的示例,请参阅此处的文档。

如果 Rekogntion 未能检测出图片中的成人内容,请通过下文介绍的反馈流程联系我们。

问:怎样向 Rekognition 提供反馈以便改进审核效果?

请通过 AWS 客户支持向我们发送您的请求。 Amazon Rekognition 会根据客户反馈持续扩大检测到的不当内容的类型。添加新的明显或暗示性成人内容通常需要 6 – 8 周时间。请注意,该反馈流程不适用于违法内容 (例如儿童色情内容)。


问:什么是面部分析?

面部分析是检测图像中的面部并从中提取相关面部属性的过程。Amazon Rekognition 的 DetectFaces API 接受图像并返回每个检测到的面部的边界框及性别、是否存在太阳镜、面部标记点等属性。您可以利用面部分析来分析人口统计学特征和客户情绪,或使用检测到的面部边界框做进一步的处理。

问:我可以从 Amazon Rekognition 获得哪些面部属性?

Amazon Rekognition 可以针对检测到的每副面孔返回以下面部属性,以及每个属性的边界框和置信度得分:

  • Gender
  • Smile
  • Emotions
  • Eyeglasses
  • Sunglasses
  • Eyes open
  • Mouth open
  • Mustache
  • Beard
  • Pose
  • Quality
  • Face landmarks

问:什么是面部姿态?

面部姿态是指检测到的面部在俯仰、翻滚和偏转轴上的旋转。这些参数中的每一个都返回为 -180 到 +180 度之间的角度。面部姿态可用于查找面部边界多边形 (与矩形边界框相对) 的方向、测量变形、精确跟踪面部等。

问:什么是面部质量?

面部质量使用锐度和亮度这两个参数来描述检测到的面部图像的质量。两个参数都返回为 0 和 1 之间的值。您可以对这些参数应用阈值,以筛选照明充足和锐利的面部。这对于对面部图像质量要求较高的应用 (如面部比较和面部识别) 非常有用。

问:什么是面部标记?

面部标记是一组突出点,通常位于关键面部组成部分 (如眼睛、鼻子和嘴) 的边角、尖端或中点处。Amazon Rekognition DetectFaces API 返回一组面部标记,可用于裁剪面部、进行面部变形、覆盖自定义遮罩以创建自定义筛选器等。

问:可以在一张图像中检测多少副面孔?

您可以使用 Amazon Rekognition 在一张图像中检测多达 100 副面孔。


问:什么面部比较?

面部比较是将一副面孔与一副或多副面孔进行比较以测量相似性的过程。借助 CompareFaces API,您可以通过 Amazon Rekognition 测量两张图像中的面部属于同一个人的可能性。API 将源输入图像中的面孔与在目标输入图像中检测到的每副面孔进行比较,并针对每次比较返回相似度得分。您还能够获得检测到的每副面孔的边界框和置信度得分。您可以利用面部比较技术以近乎实时的方式根据某人的档案照片验证其身份。

问:可以使用包含多副面孔的源图像吗?

可以。如果源图像包含多副面孔,CompareFaces 会检测最大的面孔并使用它来与在目标图像中检测到的每副面孔进行比较。

问:可以对多少副面孔进行比较?

您可以将源图像中的一副面孔与目标图像中检测到的的多达 100 副面孔进行比较。


问:什么是面部识别?

面部识别是在一组面孔中搜索某人的面孔以便识别或验证其身份的过程。您可以利用 Amazon Rekognition 的 SearchFacesSearchFacesByImage API 在应用程序中添加面部识别功能。借助面部识别,您可以轻松构建银行付款多重身份验证和员工自动化楼宇进出等多种应用程序。

问:什么是面部集合?如何创建?

面部集合是您拥有和管理的面部特征向量的可搜索索引。利用 CreateCollection API,您可以轻松地在受支持的 AWS 区域中创建集合并获取一个 Amazon 资源名称 (ARN)。每个面部集合具有与其关联的唯一 CollectionId。

问:如何向面部集合添加面部或从中删除面部?

要向现有的面部集合中添加面部,请使用 IndexFaces API。此 API 接受 S3 对象或图像字节数组形式的图像,并将检测到的面部的向量表示添加到面部集合中。IndexFaces 会为添加的每副面孔返回一个唯一的 FaceId 和面部边界框。

要从现有的面部集合中删除面部,请使用 DeleteFaces API。此 API 对使用 CollectionId 提供的面部集合进行操作,并删除与 FaceId 列表对应的条目。有关添加和删除面部的详细信息,请参阅我们的管理集合示例。

问:如何在面部集合中搜索面部?

创建好带有索引的面部集合后,您可以使用图像 (SearchFaceByImage) 或 FaceId (SearchFaces) 在其中搜索面部。这些 API 接受一副面孔并返回一组按相似度得分从高到低排列的匹配面部。有关更多详情,请参阅我们的搜索面部示例。

问:Amazon Rekognition 是否使用存储在面部集合中的数据?

不使用。未经您的许可,Amazon Rekognition 无法访问或使用存储在面部集合中的数据。您对自己的数据拥有完全的所有权。

问:什么是面部模型版本控制?它是如何工作的?
Amazon Rekognition 使用深度学习模型来执行面部检测和识别。我们会根据客户反馈和研究的最新进展来不断提高模型的准确性。我们将会以面部模型更新的形式将这些改进提供给客户。当您创建新集合时,Amazon Rekognition 会自动使用最新版本的面部模型执行此操作。现有的集合会继续使用创建它们时使用的模型版本,并且它们存储的面部矢量不会自动更新到新版本。

不同版本的模型可能相互不兼容。具体来说,如果相同的图像被索引到使用不同版本的模型的多个集合中,则检测到的相同面部的面部识别符是不同的。如果图像被编入到与相同模型相关联的多个集合索引中,那么面部识别符将是相同的。

问:如何才能知道我使用的是哪个面部模型版本?
您可以使用在面部集合上运行的任何 API 返回的 FaceModelVersion 字段来跟踪集合中使用的面部模型版本。

问:如何将现有的集合移至面部模型最新版本?
要对存储在现有集合中的面部使用最新模型,请使用 CreateCollection 创建新集合,并使用 IndexFaces 将原始源图像集重新编制到新集合索引。您需要更新应用程序存储的所有面部识别符,因为新集合中的面部识别符与旧集合中的面部识别符不同。如果您不再需要旧集合,则可以使用 DeleteCollection 将其删除。


问:什么是图像中的文本?

图像中的文本是 Amazon Rekognition 的一项功能,您可借助它来检测和识别图像中的文本,如街道名称、标题、产品名称和车辆牌照。图像中的文本专门用于处理真实图像,而不是文档图像。Amazon Rekognition 的 DetectText API 接收图像并返回每个检测到的字符串的文本标签和边界框以及置信度分数。例如,在图像共享和社交媒体应用程序中,您可以根据包含相同文本标签的图像索引启用可视化搜索。在媒体和娱乐应用程序中,您可以为视频帧创建文本元数据,以支持搜索相关内容,如新闻、体育成绩、商业广告和标题。在安全和监控应用程序中,您可以根据车身摄像头或交通摄像头拍摄的图像中的车牌号识别车辆。

问:Amazon Rekognition 图像中的文本支持哪种类型的文本?

图像中的文本专门用于处理真实图像,而不是文档图像。它支持大多数拉丁语脚本中的文本和嵌入各种布局、字体和样式,以及以各种方向作为横幅和海报覆盖在背景对象上的数字。图像中的文本可识别每个图像中最多 50 个字符序列,并将它们列为单词和行。此外,图像中的文本只能识别出水平方向向上/向下倾斜 30 度的文本。

 

问:如何向 Rekognition 提供反馈以便改进其文本识别?


请通过 AWS 客户支持向我们发送您的请求。Amazon Rekognition 会根据客户反馈持续扩大识别出的文本内容类型。

问:什么是名人识别?

Amazon Rekognition 的名人识别是基于深度学习的易用 API,用于检测和识别某一领域中著名、显赫和成绩突出的人士。构建的 RecognizeCelebrities API 可以规模化运营,并能识别许多行业的名人,如政治家、体育运动员、商业、娱乐和媒体名人等。我们的名人识别功能非常适合需要根据自己独特兴趣索引和搜索名人数字图像库的客户。

问:通过名人识别 API 可以识别哪些人?

Amazon Rekognition 只能识别深度学习模型经培训后能够识别的名人。请注意,RecognizeCelebrities API 并不是权威名单,也决不是详尽的名人列表。此功能旨在根据客户的需求和反馈包括尽可能多的名人。我们会不断添加新名称,但如果被其他团体或我们的客户视为名人的人员未被“名人识别”所识别,这并不表示我们对其名人身份的看法。如果您希望看到“名人识别”所识别出的其他名人,请提交反馈。

问:通过 Amazon Rekognition API 识别的名人是否可以申请从此功能中删除?

可以。如果名人希望从此功能中删除,则他或她可以向 AWS 客户支持发送电子邮件,我们将处理此删除请求。

问:支持哪些来源提供有关名人的其他消息?

API 支持一个可选的来源列表,用于提供有关名人的其他信息,以此作为 API 响应的一部分。目前,如果有 IMDB URL,我们就会提供。我们可能会在以后添加其他来源。


问:Amazon Rekognition 如何统计已处理的图像数量?

对于接受图像作为输入的 API,Amazon Rekognition 会将已分析图像的实际数量统计为已处理的图像数量。DetectLabels、DetectModerationLabels、DetectFaces、IndexFaces、RecognizeCelebrities 和 SearchFaceByImage 都属于这一类别。对于 CompareFaces API,当需要传递两张图像作为输入时,只有源图像会被计入已处理的图像数量。

对于不需要图像作为输入参数的 API 调用,Amazon Rekognition 将每次 API 调用计入已处理的图像数量。SearchFaces 和 ListFaces 都属于此类别。

其余的 Amazon Rekognition API (DeleteFaces、CreateCollection、DeleteCollection 和 ListCollections) 不计入已处理的图像数量。

问:Amazon Rekognition 对哪些 API 收费?

Amazon Rekognition 会对以下 API 收费:DetectLabels、DetectModerationLabels、DetectFaces、IndexFaces、RecognizeCelebrities、SearchFaceByImage、CompareFaces、SearchFaces 和 ListFaces。

问:Amazon Rekognition 的费用是多少?

请参阅 Amazon Rekognition 定价页面了解最新的价格信息。

问:在我的面部集合中存储特征向量的话需要付费吗?

需要。Amazon Rekognition 每月向每 1000 张面部向量收取 0.01 美元的费用。有关详细信息,请参阅定价页面

问:Amazon Rekognition 是否参加 AWS 免费套餐?

是的。作为 AWS 免费使用套餐的一部分,您可以免费开始使用 Amazon Rekognition。注册后,Amazon Rekognition 新客户在前 12 个月可享受:每月免费分析 5000 张图像。在此免费套餐中,您可以使用所有 Amazon Rekognition API,而且还能免费存储多达 1000 张面部图像。

问:你们的价格是否包括税费?

有关税费的详细信息,请参阅 Amazon Web Services 税务帮助


问:Amazon Rekognition 能否处理存储在 Amazon S3 上的图像?

可以。您只需将 Amazon Rekognition API 指向您的 S3 存储桶,就可以开始分析存储在 Amazon S3 中的图像。您不需要移动数据。有关如何在 Amazon Rekognition API 调用中使用 S3 对象的更多详情,请参阅我们的检测标签练习

问:使用 Amazon Rekognition 时,我能否使用另一个区域中的 Amazon S3 存储桶中存储的图像?

不能。请确保您要使用的 Amazon S3 存储桶与您的 Amazon Rekognition API 终端节点位于同一个区域内。 

问:如何使用 Amazon Rekognition 批量处理多个图像文件?

您可以按照 GitHub 上的 Amazon Rekognition 批处理示例中所述的步骤批量处理您的 Amazon S3 图像。

问:如何使用 AWS Lambda 和 Amazon Rekognition?

Amazon Rekognition 提供对 AWS Lambda 的无缝访问,并让您能够对 Amazon S3、Amazon DynamoDB 等 AWS 数据存储进行基于触发器的图像分析。要将 Amazon Rekognition 与 AWS Lambda 配合使用,请按照此处介绍的步骤进行操作,并选择一个 Amazon Rekognition 蓝图。


问:Amazon Rekognition 会不会存储我提交用于分析的图像?

不会。除非您向我们提供这样做的权限。Amazon Rekognition API 不存储用户提交的用于分析的图像。对于面部集合,Amazon Rekognition 只将面部表征存储为特征向量形式的面部元数据,而不是可识别的面部剪切图像。请注意,通过 AWS Support 提交的用于故障诊断的图像可能会被存储并用于训练目的,当您提交此类图像时会看到相关声明。

问:Amazon Rekognition 会不会将提交的图像用于训练目的?

不会。除非您向我们提供这样做的权限。如果您打算共享图像数据集并向 Amazon Rekognition 提供训练权限,请联系 AWS 客户支持部门了解详情。

问:是不是必须向 Amazon Rekognition 提供训练数据?

没有。Amazon Rekognition 已预先经过训练,可以检测数千种标签,根据各种条件检测面部,并能够用一组紧凑的特征向量表示一张面孔。您不需要提供任何训练数据或自定义任何模型设置。Amazon Rekognition 会继续改进其模型,并定期补充其标签目录。


问:如何控制对 Amazon Rekognition 的用户访问?

Amazon Rekognition 与 AWS Identity and Access Management (IAM) 集成。您可以使用 AWS IAM 策略确保只有授权用户才能访问 Amazon Rekognition API。有关更多信息,请参阅 Amazon Rekognition 身份验证和访问控制页面