发布于: Nov 1, 2022

Amazon Textract 是一种机器学习服务,可从任意文档或图像中自动提取打印的文本、手写内容和数据。AnalyzeExpense 是 Textract 中的专用 API,它可以理解发票和收据的上下文,并自动提取供应商名称和发票号码等相关数据。今天,我们很高兴地宣布推出 AnalyzeExpense 的主要增强功能,其中包括新字段支持和提高现有字段准确度。

最新 AnalyzeExpense API 支持超过 40 个标准化字段。新支持的标准化字段包括摘要字段(例如供应商地址)和行项目字段(例如产品代码)。通过这项新功能,客户可以直接提取所需的信息,节省编写和维护复杂的处理后代码的时间。除了支持新字段之外,我们还进一步提高了之前版本中已支持的字段(例如供应商名称与合计)的准确度。

除了标准化键值对和常规键值对之外,AnalyzeExpense 现在还在 API 响应中提供完整的 OCR 输出。客户可以通过单个 API 请求获取键值对和原始的 OCR 提取内容。

从 10 月 31 日起,此更新已在以下区域推出:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(北加利福尼亚)、美国西部(俄勒冈州)、亚太地区(孟买、首尔、新加坡、悉尼)、加拿大(中部)、欧洲地区(法兰克福、爱尔兰、伦敦、巴黎)以及 AWS GovCloud(美国东部、美国西部)。

要开始使用,请登录到 Amazon Textract 控制台以试用新功能。要了解有关 Textract 功能的更多信息,请访问 Amazon Textract 网站开发人员指南资源页面