发布于: Dec 1, 2021

Amazon Textract 是一种机器学习服务,可从任何文档或图像中轻松提取文本和数据,并且现在为从身份文档提取数据提供专业支持,例如美国驾照和美国护照。可以按照键值对的形式提取诸如姓名和地址之类的隐式字段,以及诸如出生日期、签发日期、到期日期、ID 号、ID 类型等显式字段。在此之前,当前基于 OCR 的解决方案数量有限,并且由于内容丰富的背景图像,无法提供准确提取所有必需字段的功能,也无法识别姓名和地址以及与之相关的字段(例如,华盛顿州 ID 列出带有键“8”的家庭住址),同样无法支持因国家/地区或州而异的 ID 设计和格式。

从今天开始,您可以快速准确地从具有不同模板或格式的 ID(美国驾照和护照)中提取信息。Analyze ID API 返回两类数据类型:
  • ID 上提供的键值对,例如出生日期、签发日期、ID 号和限制
  • 文档中的隐含字段,这些字段可能没有与其关联的显式键,例如姓名、地址和签发机构

此外,我们标准化响应中的键名称。例如,如果您的驾照显示 LIC#(驾照号),而护照显示护照号,Analyze ID 响应会将作为“文档 ID”的标准化键与原始键(例如 LIC#)一起返回。这种标准化可让客户轻松地将多个 ID 中的信息组合在一起,这些 ID 针对同一概念使用不同的术语。

要了解有关此新功能的详情,可以阅读分步博客以立即开始使用,也可以查看相关文档。Amazon Textract 的定价页面上提供了这一新功能的定价。 

从 2021 年 12 月 1 日开始,Analyze ID 将在下列区域推出:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、GovCloud(美国东部)、GovCloud(美国西部)、加拿大(中部)、欧洲(伦敦)、欧洲(巴黎)、欧洲(爱尔兰)、欧洲(法兰克福)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(首尔)和亚太地区(孟买)。要开始使用 Analyze ID,请访问:http://aws.amazon.com/textract