文档有各种文件类型、各种格式,并包含有价值的信息。 在大多数情况下,您会手动处理文档,这样做非常耗时,容易出错,成本也很高。您不仅要快速获得这些信息,而且很可能需要将这些文档中的信息用于下游应用程序。
为了帮助克服这些挑战,AWS Machine Learning (ML) 现在为您提供了从任何文档格式(如保险索赔、抵押贷款、医疗保健索赔、合约和法律合同)的复杂内容中提取信息的选择。
优点

数据准确性更高
使用 ML 可以帮助您更快、更准确地处理文档,从而减少手动输入引起的错误。如果数据需要 100% 准确,则可以随时进行人工干预并查看数据。

加快数据处理
实施智能文档处理可以帮助您在几天内完成数周或数月的工作。

提高员工的工作效率
机器学习免除了从文档中获取见解并将信息输入各种系统的手动过程,使您的员工可以将更多的时间投入在增值业务任务上。

节省成本
自动执行文档工作流程可以降低数据提取和分析的复杂性,
从而降低每个文档的平均成本。
行业
银行
抵押贷款包中包含不同的文件类型,如报税文件、W-2 表格、工资单和申请,这些文件通常需要进行拆分和分类。使用 ML,您可以通过光学字符识别 (OCR) 和自然语言处理 (NLP) 的组合,从抵押贷款申请中提取最重要的信息,如资产估值、信用评分或房产价值,以加快对客户的响应时间。
保险
很多保险表单有各种不同的布局和格式,这使得文本提取很困难。使用机器学习,您可以从文档的各个部分提取相关字段,如维修估算、物业地址、案例 ID 等,或轻松对文档进行分类。通过结合文本提取和 NLP,您可以更快、更准确地处理保险表单(如保险报价、活页夹、ACORD 表单和索赔表单)。
资本市场
财务委托书、SEC 文件(10-K、8-K、14A、497K 等)、KYC 表格、税务文件等都采集密集的文本格式,或者混合了表格和文本,使用传统方法很难处理。使用 AWS ML,您可以使用 OCR 和 NLP 组合来处理各种格式和文件类型,以提取表格式并从文档中派生实体,并使用自定义模型来识别实体并对文档进行分类。
医疗保健
很多医疗保健表单具有自由格式文本、密集的段落、复选框和表格。 使用 ML,从这些文档中提取需要的数据,无论布局如何。 通过使用表单和表格提取 API 和自然语言处理,您不仅可以利用文本提取,还可以从医疗表单中提取医学术语,以便为患者和订阅者提供快速结果。
智能文档处理合作伙伴
AWS 已经组建了一个合作伙伴团队,他们在不同行业应用机器学习文档处理工作流方面具有深厚的专业知识。来自 AWS 合作伙伴的 AWS 智能文档处理解决方案提供了一整套解决方案,可以帮助降低成本、增加收入,并提高参与度。前往合作伙伴的页面以查找适合您的使用案例的合作伙伴解决方案。
资源
了解如何通过机器学习来大规模克服文档处理和分析难题
使用 AWS 构建端到端智能文档处理解决方案
了解有关文档理解 (DUS) 解决方案的更多信息