Amazon Textract

从任何文档中自动提取打印的文本、手写字和数据

持续 3 个月每月最多免费分析 1000 页

包含在 AWS 免费套餐中 

使用人工智能 (AI) 从文档中提取文本和结构化数据,例如表格和表单 - 无需配置或模板。

通过从文档中提取关系、结构和文本,超越简单的光学字符识别 (OCR)。

通过稳健的数据隐私、加密、安全控制提高安全性和合规性,并支持 HIPAA、GDPR 等合规性标准。

使用 Amazon Augmented AI (A2I) 轻松实施人工审核,持续管理微妙或敏感的工作流程和审计预测。

工作原理

Amazon Textract 是一种机器学习 (ML) 服务,从扫描的文档(如 PDF)中自动提取文本、手写内容和数据。它不是简单的光学字符识别技术(OCR),而是可以识别、理解并提取表单和表格中的数据。如今,许多公司都需要从扫描文档(如 PDF、图片、表格和表单)中手动提取数据,或通过简单的 OCR 软件,而这些软件需要手动配置,当表单发生变化时,往往还需要重新配置。为了避免这些昂贵的手动流程,Textract 使用 ML 来读取和处理任何类型的文档,可以精确地提取文本、手写字、表格和其他数据,不需要任何手动工作。您可以快速自动处理文档,并对提取的信息采取操作,无论是自动处理贷款还是从发票和收据中提取信息。Textract 可以在几分钟内提取数据,而不再需要耗费几小时甚至几天的时间。此外,您还可以使用 Amazon Augmented AI 添加人工审核,对模型提供监督,检查敏感数据。

使用案例

金融服务

准确提取抵押贷款利率、申请人姓名和发票总额等各种金融表格的关键业务数据,以在数分钟内处理贷款和抵押贷款申请。

医护及生命科学

从健康摄食表单、保险金申请和预授权表单中提取重要患者数据后,您可以更好地为患者和保险公司服务。保持数据在其原始上下文中组织有序,免去对输出的人工审查。

公共部门

轻松地从政府相关表格中提取相关数据,例如小企业贷款、联邦税表或商业申请,具有高度的准确性。

如何开始使用

探索 Amazon Textract 的工作原理

阅读有关 OCR、表单提取、表格提取等的信息。

探索 Amazon Textract 功能 »

试用 AWS 免费套餐


立即免费开始使用 Amazon Textract。

注册免费账户 »

探索 Amazon Textract


在 AWS 管理控制台中,使用 Amazon Textract 开始构建。

在控制台中开始使用 »

更深入了解 AWS