发布于: Mar 30, 2022

Amazon Textract 是一种机器学习服务,让您可以从绝大部分文档中轻松提取文本和数据。我们根据客户反馈持续改进基础的机器学习模型,以提供更高的准确性。今天,我们很高兴地宣布,我们对表和复选框检测功能做出了几项大幅增强。

最新的表模型支持检测合并的单元格和识别列标题。特别是,现在您可以通过 "Type": "MERGED_CELL" 检测使用 AnalyzeDocument-Tables 功能处理的文档中的合并单元格,还可以通过 "EntityTypes": ["COLUMN_HEADER"] 标识符识别构成列标题的单元格。另外,我们很高兴地宣布,我们对表功能做出了大幅增强。从现在开始,Textract 可以更准确地检测外部表边界、行和列边界以及表内容。现在,在各种文档类型中提取表时,客户可以获得更高的准确性和更少的后处理工作,包括贷款、保险、金融服务、法律、健康、能源和公共部门。

最后,我们改进了表单模型中的复选框检测功能。有了这项改进,您现在可以利用 Amazon Textract 在表单内的复选框中更准确地检测选定/未选定的手写信息。

要开始使用,请登录到 Amazon Textract 控制台,试用最新的表和复选框检测功能。要了解关于 Textract 功能的更多信息,请访问 Amazon Textract 网站开发人员指南资源页面