发布于: Oct 1, 2019
Amazon Textract 是一种机器学习服务,让您可以从绝大部分文档中轻松提取文本和数据。 Textract 这类服务的一大优势在于,随着时间的推移,客户可以享受持续改进带来的好处。今天,我们很高兴地宣布推出一系列提高 Amazon Textract 准确性的质量改进。
首先,我们提高了文本识别功能的准确性。其次,Amazon Textract 现在可以更准确地更正文档旋转,并将文档与其背景隔离开以实现更准确的文本提取。这些优势适用于很多类型的文档,但它们尤其适合具有以下特点的文档:包含稀疏文本;具有非标准纸张尺寸;纸张有少量变形(例如折角);文档周围存在极特别或异常的背景;部分文档被遮盖。最后,我们重新调整了文本检测功能的置信度得分,使其与我们模型的基础准确度更加一致。
点击此处即可马上开始使用 Amazon Textract。