Amazon Textract

几乎可以从任何文档中轻松提取打印的文本、手写字和数据

Amazon Textract 是一项机器学习服务,可以从扫描的文档中自动提取文本、手写字和数据。它不只是简单的光学字符识别 (OCR),而是可以识别、理解和提取表单和表格中的数据。如今,许多公司都需要从扫描文档(如 PDF、图像、表格和表单)中手动提取数据,或者通过简单的 OCR 软件,而这些软件需要手动配置,当表单发生变化时,往往还需要重新配置。为了消除这些手动且昂贵流程,Textract 使用机器学习来读取和处理任何类型的文档,并且可以精确地提取文本、手写字、表格和其他数据,不需要任何手动工作。您可以快速自动处理文档,并对提取的信息采取操作,无论是自动处理贷款还是税务文档。Textract 在几分钟内即可提取数据,而不再需要耗费几小时甚至几天的时间。此外,您还可以使用 Amazon Augmented AI 添加人工审核,对模型提供监督,并对敏感数据执行审核。

免费提供 1000 页

每月,通过 AWS 免费套餐提供

优势

提取结构化数据和非结构化数据

Amazon Textract 使用人工智能像人一样阅读,根据上下文提取文本、布局、表格、表单和结构化数据,无需配置、训练或自定义代码。

不只是简单的光学字符识别 (OCR)

Amazon Textract 使用 OCR 技术来识别表单标签和值并从表格中提取信息,不会损坏数据结构并且成本低廉。您只需按实际使用量付费,不存在预付费用承诺,也不需要签订长期合同。

选择数据安全性与合规性

Amazon Textract 符合服务组织控制 (SOC)、国际标准化组织 (ISO) 以及 PCI、HIPAA 和 GDPR,这意味着客户可以深入了解保护客户数据的安全流程和控制机制。此外,Textract 通过 AWS Privatelink 和 KMS 支持 Amazon Virtual Private Cloud (VPC) 终端节点,从而使客户能够避免使用公共互联网和加密其数据。

轻松实现人工审核

Amazon Textract 直接与 Amazon Augmented AI (Amazon A2I) 集成,让您可以对文档中提取出的文本轻松执行人工审核。您可以通过内置人工审核来管理需要人工监督并有细微差别的工作流或敏感工作流,从而取得高确信度的预测或对预测进行持续审计。

使用案例

金融服务

金融服务

抵押贷款申请、W-2s 等财务表格可能包含抵押贷款利率、申请人姓名和重要税务信息等需要提取和分析的关键业务信息。通过 Amazon Textract,您可以从扫描文档、表格和表单中提取信息,并在几分钟内处理申请,为客户提供快速响应。

保健与生命科学

保健与生命科学

Amazon Textract 可以扫描数以千计的医疗和保险表单,从这些表单中提取信息,并将信息组织起来保存在原始上下文中,从而避免您手动审核输出。从健康摄食表单、保险金申请和预授权表单中提取重要患者数据后,您可以更好地为患者和保险公司服务。

公共部门

公共部门

处理与政府相关的表单,如小企业贷款、联邦税务表单或企业申请,往往需要耗费数千个人工工时来提取相关的重要数据。Amazon Textract 可以从这些文档中提取所有数据,无论是扫描图像、PDF 还是使用光学字符识别 (OCR) 扫描的文档。Textract 不仅可以识别每个字符、单词和字母,还可以高精度地识别表单字段的内容和表格中存储的信息。

客户成功案例

Kabbage

Kabbage 是一家提供小型企业现金流解决方案的数据和科技公司,其解决方案包括访问灵活的信贷额度、在线支付、现金流见解和商业支票账户。

“Amazon Textract 帮助我们支持 80% 的 PPP 申请者享受完全自动化的借贷体验,并将批准时间从几天缩短到 4 小时(平均速度)。到计划结束时,按申请量计,我们已成为美国第二大 PPP 贷款机构,超过了美国的主要银行,为超过 297,000 家小型企业提供服务,并在全美范围内保留了约 945,000 个工作岗位。”

Anthony Sabelli,Kabbage 数据科学部门主管

Change Healthcare

Change Healthcare 是一家领先的独立医疗技术公司,提供数据和分析驱动的解决方案,以改善美国医疗保健系统中的临床、财务和患者参与度结果。

“在 Change Healthcare,我们相信,通过改善财务和行政决策的及时性和质量,我们可以使所有人都能负担得起并能获得医疗保健。机器学习技术的强大功能可以从我们的数据中了解更多信息,从而实现这一目标。但是,释放这些信息的潜力通常很困难,因为它分别存储在一个个表格和表单中,而传统的光学字符识别无法对其进行分析。Amazon Textract 除处理文本之外,还具有检索结构化数据的能力,从而进一步提高了理解文档的能力。现在,随着该服务达到 HIPAA 的要求,我们将能够从数百万个文档中将信息解放出来,并为患者、付款方和提供商创造更多价值。”

Nick Giannasi,Change Healthcare 执行副总裁兼首席人工智能(AI)官

Filevine

Filevine 是法律专业人员的运营核心,包括基于云的案例和事务管理、文档管理和深度报告分析。自从 2015 年启动以来,Filevine 一直专注于快速创新和屡获殊荣的设计,获得了独立评审网站的最高评级。

“Filevine 每天处理数百万个事务和案例文件。我们选择 Amazon Web Services 是因为我们希望为客户提供世界一流的文档搜索解决方案。Amazon Textract 快速、准确且可扩展,可以帮助 Filevine 满足全世界最大并且最复杂的法律机构的苛刻要求。通过 Filevine 和 Amazon,法律专业人员在海量文件中查找所需内容不再像是大海捞针,而是变得无比简单。”

Ryan Anderson,Filevine 首席执行官

Intuit

Intuit 是创新型财务管理解决方案提供商,面向全球大约 5000 万客户提供服务,他们的产品有 TurboTax 和 QuickBooks 等。

“Intuit 的文档理解技术利用人工智能(AI)消除了消费者、小型企业和自营职业客户手动输入数据的需求。对于每年数百万依赖 TurboTax 的美国人来说,这项技术简化了报税手续,使他们免于繁琐而耗时的在财务文件中输入数据的工作。Textract 是 Intuit 文档理解能力的重要组成部分,能够在复杂财务表单的上下文中分析文本,从而提高数据提取的准确性。”

Krithika Swaminathan,Intuit 人工智能(AI)副总裁

Standard Product Icons (Features) Squid Ink
查看 Amazon Textract 的功能

发现更多 Amazon Textract 的功能。

了解更多 
Sign up for a free account
注册免费账户

立即享受 AWS 免费套餐。 

注册 
Standard Product Icons (Start Building) Squid Ink
开始在控制台中构建

在 AWS 管理控制台中,使用 Amazon Textract 开始构建。

注册