自动从文档中处理数据

通过智能文档处理功能提高员工工作效率并更快做出决策

包括金融服务和医疗保健在内的各行各业的组织都有大量需要处理的文件。这些文件(例如发票、患者表格、贷款申请和合同)包含诸如申请人姓名、实体(地点或品牌)或患者健康历史记录之类的数据,这些数据对他们的业务流程至关重要。

需要从数字文档中提取所有这些数据,以执行诸如处理贷款申请、分析客户情绪、确定患者治疗方法或从发票中筛选出不合规定的购买等任务。目前,组织每年花费数百万美元来手动执行此操作,这种做法不但耗时、易出错、价格昂贵,而且难以扩展。

为了帮助克服这些挑战,AWS 推出了由机器学习提供支持的智能文档处理解决方案。您可以从数百万个文档中提取文本、了解这些文档之间的情感或关系,甚至可以纳入人工步骤来验证、更正或增强机器学习结果,以提高准确性和合规性。

使用机器学习自动从文档中提取和分析数据 (2:41)

优点

提供更好的个性化体验

数据准确性更高

使用 ML 可以帮助您更快、更准确地处理文档,从而减少手动输入引起的错误。如果数据需要 100% 准确,则可以随时进行人工干预并查看数据。

提高客户参与度

加快数据处理

实施智能文档处理可以帮助您在几天内完成数周或数月的工作。

个性化每个接触点

提高员工的工作效率

机器学习免除了从文档中获取见解并将信息输入各种系统的手动过程,使您的员工可以将更多的时间投入在增值业务任务上。

个性化每个接触点

节省成本

自动执行文档工作流程可以降低数据提取和分析的复杂性,
从而降低每个文档的平均成本。

客户案例

Pulselive
“我们努力将技术和专业知识结合起来,帮助我们的客户了解他们的供应链数据。为了做到这一点,我们需要通过某种方法大规模地对自由格式的合规性文档进行实时分类。我们的流程是从具有表单和表格的图像和 PDF 中提取半结构化文本,并在这些文档中提取自定义实体。通过 Amazon Textract 的 OCR 技术,我们能够处理文档,而 Amazon Comprehend 则能够提取自定义实体。我们还需要使用 Amazon Augmented AI (Amazon A2I) 将人员纳入我们的流程中,以便我们的团队能够在给定的精度范围内审查文档,并帮助训练我们的下一个模型迭代。通过将这些服务与 AppSync 和 Amplify 结合起来,可以在更短的时间内为我们提供对客户供应链风险更准确的洞察,从而为客户节省数百小时人工审核文档时间。他们现在可以获得关于公司是否存在合规风险的反馈。”

Corey Peters,资产合规部高级软件开发人员

Lotte Mart
“过去 25 年来,我们一直致力于开发先进的机器学习功能来挖掘、连接、加强、组织和传递信息给我们的客户,成功帮助他们简化工作并从中获得更多价值。我们借助 Amazon SageMaker 为一款问答应用程序设计了自然语言处理功能。我们的解决方案需要使用 Amazon SageMaker 的多个功能,对深度学习配置进行数次迭代。”

Khalid Al-Kofahi,Thomson Reuters AI 和认知计算中心

Lotte Mart
“Amazon Textract 帮助我们支持 80% 的 PPP 申请者享受完全自动化的借贷体验,并将批准时间从几天缩短到 4 小时(平均速度)。到计划结束时,按申请量计,我们已成为美国第二大 PPP 贷款机构,超过了美国的主要银行,为超过 297,000 家小型企业提供服务,并在全美范围内保留了约 945,000 个工作岗位。”

Anthony Sabelli,Kabbage 数据科学部门主管

Lotte Mart
“我们的团队每年处理和验证大量财务文件,以便向我们的客户提供贷款和租赁服务。在某些情况下,所需的资助文件可能不一致或扫描效果不佳。通过使用 Amazon Augmented AI (A2I) 和 Amazon Textract,我们能够将花费在审阅文档上的时间减少多达 80%,”Dealnet Capital 首席技术官 Matthew Lewis 说。“能够将人工审查工作流与 A2I 结合起来,大规模审核从我们所有财务文件中提取的文本的准确性,这使我们更加确信,我们由机器学习提供支持的系统将提供最高质量的文件,以满足我们严格的合规性和文件验证标准。”

Dealnet Capital 首席技术官 Matthew Lewis

选择符合您需求的解决方案

AWS 提供了几种灵活的方法,您可以使用它们来实施基于机器学习的智能文档处理解决方案,以自动从推动业务发展的文档中提取、处理和分析数据。对于想要立即开始使用经过预先训练的智能文档处理解决方案的组织,AWS 提供了诸如 Amazon Textract、Amazon Comprehend 和 Amazon A2I 等完全托管的服务。这些 AWS 服务结合在一起或单独使用,可以提供降低成本和人工的有效方式,同时改善您的业务成果。想要开发自己的机器学习模型进行智能文档处理的组织可以使用 Amazon SageMaker,这是一项完全托管的服务,可帮助数据科学家和 ML 开发人员快速构建、训练和部署 DIY 机器学习模型。无论选择哪种方案,Amazon SageMaker 都会提供端到端机器学习所需的所有工具,让您可以轻松开发高质量的文本处理模型。

Amazon Textract

Amazon Textract 是一项完全托管的机器学习服务,可从扫描文档中自动提取手写内容、打印文本以及数据。此服务超越了传统的光学字符识别 (OCR) 技术,后者需要手动进行配置,并且每次更改表单时都需要更新配置,而 Amazon Textract 则能准确提取文本、表单、表格和其他数据,无需任何人工操作或自定义代码。借助 Textract,您可以快速自动执行文档处理工作,几小时即可处理数百万个文档页面。获取信息之后,您可以在业务应用程序中根据这些信息执行操作,以便启动贷款申请、税务文件、报名表格或医疗索赔处理等工作的后续步骤。

了解有关 Amazon Textract 的更多信息 » 

Amazon Comprehend

Amazon Comprehend 是一项自然语言处理 (NLP) 服务,可通过机器学习发现文本中的见解和关系。该服务可以识别文本的语言、提取关键短语、地点、人物或品牌、了解文本中的情感,并按主题自动组织文本文件的集合。您可以训练 Amazon Comprehend 识别与您的组织相关的实体,例如产品名称、零件编号、部门名称等。您还可以训练 Amazon Comprehend 对文档进行分类或为文本分配相关标签。

了解有关 Amazon Comprehend 的更多信息 »

Amazon Comprehend Medical

Amazon Comprehend Medical 是一项自然语言处理服务,它可以利用机器学习技术从非结构化文本中提取相关医疗信息,专为医疗保健客户设计。借助 Amazon Comprehend Medical,您可以从医生笔记、临床试验报告和患者健康记录等多种来源快速准确地收集医学状况、药物、剂量、使用强度和频率等信息。Amazon Comprehend Medical 还可以将检测到的信息链接到医学本体,例如 ICD-10-CM 或 RxNorm,以便下游医疗保健应用程序轻松使用。

了解有关 Amazon Comprehend Medical 的更多信息 »

Amazon A2I

Amazon Augmented AI (Amazon A2I) 可以轻松构建和管理机器学习应用程序的人工审核。Amazon A2I 为常见的机器学习用例(例如从文档中提取文本)提供了内置的人工审核工作流程。通过使用 Amazon A2I,您可以将任何文档发送给人员进行审核,从而确保文本、短语或信息得到正确处理。此外,您还可以使用此人工检查信息来重新训练机器学习模型,以确保下游准确性。

了解有关 Amazon A2I 的更多信息 »

Amazon SageMaker

Amazon SageMaker 是一项完全托管的服务,可以帮助开发人员和数据科学家快速构建、训练和部署机器学习模型。SageMaker 完全消除了机器学习中每个步骤的繁重工作,让开发高质量模型变得更加轻松。SageMaker 提供了一些内置的机器学习算法,例如 BlazingText 和 Linear Learner,它们针对文本分类、自然语言处理 (NLP) 和光学字符识别 (OCR) 进行了优化,您可以轻松使用它们来训练和部署模型。您也可以将自己的文本处理算法或模型(例如热门的基于转换器的双向编码器表示形式 (BERT))引入 Amazon SageMaker,或从 AWS Marketplace 上提供的数百种算法和预先训练的模型中进行选择。此外,借助 SageMaker Autopilot,组织可以使用自动机器学习 (AutoML) 功能轻松生成文本处理模型。SageMaker 可以通过这些选项中的任何一个提供机器学习所需的所有组件,包括首个用于机器学习的完全集成开发环境 (IDE),使团队可以开发和共享 ML 模型,并轻松跨数据科学团队进行协作,所有这些操作都可在单一界面中完成。SageMaker 为组织提供了对 ML 工作流每个步骤的完全访问权限、控制性和可视性,包括持续监控质量问题并在发现问题时发出警报。SageMaker 可帮助团队以更少的工作量和更低的成本将 ML 模型更快投入生产,并且能够不断改进其模型。

了解有关 Amazon SageMaker 的更多信息 »

资源

了解如何通过机器学习来大规模克服文档处理和分析难题

观看网络研讨会 »

使用 AWS 构建端到端智能文档处理解决方案

阅读博客 »

了解有关文档理解 (DUS) 解决方案的更多信息

查看 GitHub 存储库 »

准备好开始使用了吗?

联系销售人员
联系我们

联系我们,了解有关适用于智能文档处理的机器学习解决方案的更多信息

联系我们 
开始使用执行计划
开始执行文档处理计划

AWS Professional Services 组织是由专家组成的全球团队,可以帮助您在使用 AWS 云时实现预期业务成果。

了解更多 
寻找合作伙伴
寻找合作伙伴

联系 AWS 合作伙伴网络,与我们的全球技术和咨询合作伙伴合作

开始使用