发布于: Jun 23, 2021
Amazon Textract 是一项机器学习服务,可以从扫描的文档中自动提取文本、手写字和数据。它不只是简单的光学字符识别 (OCR),而是可以识别、理解和提取表单和表格中的数据。我们根据客户反馈持续改进基础的机器学习模型,以提供更高的准确性。今天,我们很高兴地宣布,我们对表单提取功能进行了精度增强更新。从现在开始,Textract 可以更准确地检测文档和图像中的复选框和键值对。对于发票和收据,此准确性得到特别提高,但是客户仍然可在金融、医护、法律、公共部门等的许多文档中看到改进之处。
此次更新将分批次发布,首先是于 6 月 23 日在亚太地区(悉尼)、亚太地区(新加坡)发布,然后于 6 月 24 日在欧洲(爱尔兰)、欧洲(巴黎)、欧洲(法兰克福)、欧洲(伦敦)、亚太地区(首尔)、亚太地区(孟买)发布,接下来是于 6 月 28 日在加拿大(中部)、美国西部(加利福尼亚北部)、美国东部(俄亥俄)、GovCloud(美国西部)、GovCloud(美国东部)发布,最后是于 6 月 29 日在美国东部(弗吉尼亚北部)、美国西部(俄勒冈)发布。