Amazon Textract 是一种机器学习(ML)服务,从扫描的文档(如 PDF)中自动提取文本、手写内容和数据。它不是简单的光学字符识别技术(OCR),而是可以识别、理解并提取表单和表格中的数据。使用 Amazon Textract 时,您只需按实际用量付费。既没有最低费用,也无需预先承诺。Amazon Textract 仅对处理的页面收费,无论您是提取文本、带表格的文本、表单数据、查询还是处理发票和身份文档。 有关页面和可接受的 Amazon Textract 用途,请参阅常见问题

Amazon Textract 有五种不同的 API:Detect Document Text API、Analyze Document API、Analyze Expense API、Analyze ID API 和 Analyze Lending API。

Detect Document Text API 使用 OCR 技术从文档中提取文本和手写内容。

Analyze Document API 有四个功能:表单、表格、查询和签名。您可以灵活调用表单、表格、查询和签名的任意组合。

  • Analyze Document API for Forms 提取诸如键值对(“名字”和关联值,如“Jane Smith”)之类的数据。它还使用 OCR 技术从文档中提取所有文本和手写内容。
  • Analyze Document API for Tables 提取按列和行组织的表格数据。它还使用 OCR 技术从文档中提取所有文本和手写内容。
  • Analyze Document API for Queries 为您提供了从文档中指定所需信息(例如,”客户名称是什么?”)以及接收该数据(例如,“Jane Doe”)作为响应的一部分的灵活性。您不需要担心文档中数据的结构,也不需要担心数据在不同格式和文档版本之间的布局如何变化。它还使用 OCR 技术从文档中提取所有文本和手写内容。
  • 适用于自定义查询的 Analyze Document API 使您能够为特定于业务的文档调用自定义查询功能。您可以使用 AWS 管理控制台训练适配器,并使用 Analyze Document API 请求中的适配器标识符来使用自定义查询。
  • Analyze Document API for Signatures 能够检测任何文档或图像上的手写签名、电子签名和首字母缩写。它还使用 OCR 技术从文档中提取所有文本和手写内容。

 

Analyze ID API 使用机器学习了解身份证件的上下文,如美国护照、驾驶执照和其他 ID。您可以自动提取特定信息,如过期日期和出生日期,以及智能识别和提取隐含信息,如姓名和地址。每个 ID 图像被视为一个页面。
 
Analyze Lending API 是一种专门的抵押文件处理 API,可自动对一系列抵押相关申请文件中的信息进行分类和提取。Analyze Lending 的机器学习模型已经针对典型抵押贷款申请包中常见的各种文件类型进行了预训练。Analyze Lending 将准确地分类、拆分和提取结果,并提供结果摘要,包括是否在页面上检测到签名。
 

请求自定义报价

对于大容量使用案例,请联系我们的销售团队以请求自订价格提案。

免费套餐

作为 AWS 免费套餐的一部分,您可以免费开始使用 Amazon Textract。免费套餐将持续三个月,新的 AWS 客户最多可以分析:

Detect Document Text API:每个月 1000 个页面
Analyze Document API

  • 仅使用签名功能时,每月 1000 个页面
  • 使用表单、表格和布局功能时,每月 100 页
  • 每月 100 页,用于查询、表单 + 查询、表格 + 查询、表单 + 表格 + 查询
  • 自定义查询没有免费套餐

Analyze Expense API:每月 100 个页面

Analyze ID API:每月 100 个页面

Analyze Lending API:每月 2000 个页面

Amazon Textract API 定价

预训练功能

*Analyze Document API 输出包含有 OCR,无论所选的功能类型如何
*Analyze Expense 和 Analyze ID API 的输出中包含 OCR

预训练 + 自定义功能

超出免费套餐后的定价示例

定价示例 1 - Detect Document Text API

假设您希望使用 Detect Document Text API 从 100000 页研究报告中提取文本。在美国西部(俄勒冈)区域的每页价格为前 100 万页 0.0015 USD,成本为 150 USD。

处理的总页数 = 100000

每页价格 = 0.0015 USD

每月总费用 = 0.0015 USD * 100000 = 150 USD

定价示例 2 - Detect Document Text API

假设您希望使用 Detect Document Text API 从 200 万页研究报告中提取文本。在美国西部(俄勒冈)区域的每页价格为前 100 万页 0.0015 USD,超过 100 万页后为 0.0006 USD,因此处理 200 万页的总费用将为 2100 USD。

处理的总页数 = 2000000

每页的价格 = 前 100 万页 0.0015 USD 和 100 万页以后每页 0.0006 USD

每月总费用 = 0.0015 USD * 1000000 + 0.0006 USD * 1000000 = 1500 USD + 600 USD = 2100 USD

定价示例 3 - Analyze Document API – 表单和表格

假设您希望使用 Analyze Document API 从 5000 页的税务表单中提取文本和结构化的数据。在美国西部(俄勒冈)区域的价格为 100 万含表格的页面每页 0.015 USD,含表单的页面每页 0.05 USD,总费计 325 USD。

处理的总页面数 = 5000 页

含表格的页面价格 = 0.015 USD

含表单(键-值对)的页面价格 = 0.05 USD

总费用 = 0.015 USD * 5000 + 0.05 USD * 5000 = 75 USD + 250 USD = 325 USD

定价示例 4 - Analyze Document API – 表单和表格

假设您想使用 Analyze Document API 从 200 万页纳税申报表中提取文本、表单和表格。在美国西部(俄勒冈)区域的价格为 100 万含表格的页面每页 0.015 USD,超过 100 万页后为每页 0.01 USD。含表单的页面价格为前 100 万页每页 0.05 USD,100 万页之后每页 0.04 USD。总费用将为 115000 USD。

处理的总页数 = 2000000 页

含表单(键-值对)的页面价格 = 前 100 万页每页 0.05 USD,接下来 100 万页每页 0.04 USD

总费用 = 0.015 USD * 1000000 + 0.01 USD * 1000000 + 0.05 USD * 1000000 + 0.04 USD * 1000000 = 15000 USD + 10000 USD + 50000 + 40000 = 115000 USD

定价示例 5 - Analyze Document API - 查询

假设您希望使用 Analyze Document API 从 5000 页的抵押贷款表单中提取文本。您还希望通过查询从每个页面中提取 10 个特定的数据点。在美国西部(俄勒冈)区域的价格为 100 万个页面每页 0.015 USD,总费用 75 USD。

处理的总页面数 = 5000 页

使用查询的每个页面价格 = 0.015 USD

总费用 = 0.015 USD * 5000 = 75 USD

定价示例 6 – Analyze Document API – 表单以及表格和查询

假设您想使用 Analyze Document API 从 200 万页工资条中提取文本、表单和表格。您还希望通过查询从每个页面中提取 10 个特定的数据点。在美国西部(俄勒冈)区域的价格为 100 万含表格、表单和查询的页面每页 0.070 USD,超过 100 万页后为每页 0.055 USD。总费用将为 125000 USD。

处理的总页数 = 2000000 页 

含表格、表单和查询的页面价格 = 前 100 万页每页 0.070 USD,接下来 100 万页每页 0.055 USD 

总费用 = 0.070 USD * 1000000 + 0.055 USD * 1000000 = 70000 USD + 55000 USD = 125000 USD

定价示例 7 – Analyze Document API – 表单和查询

假设您希望使用 Analyze Document API 从 5000 页的税务表单中提取文本和表格数据。您还希望通过查询从每个页面中提取 10 个特定的数据点。在美国西部(俄勒冈)区域的价格为 100 万含表格和查询的页面每页 0.020 USD,超过 100 万页后为每页 0.015 USD。总费用将为 100 USD。

处理的总页面数 = 5000 页

含表格和查询的页面的价格 = 0.020 USD

总费用 = 0.020 USD * 5000 = 100 USD

定价示例 8 - Analyze Document API – 签名

假设您要检测签名并使用 Analyze Document
API – 签名功能类型从 10 万页抵押文档中提取原始文本。美国西部(俄勒冈州)区域的价格为前 100 万页每页 0.0035 USD,费用为
350 USD。
处理的总页面数 = 100000
每页价格 = 0.0035 USD
每月总费用 = 0.0035 USD * 100000 = 350 USD

定价示例 9 - Analyze Document API – 签名

假设您要检测签名并使用 Analyze Document API
API – 签名功能类型从 500 万页的抵押文档中提取原始文本。美国西部(俄勒冈州)区域的价格为前 100 万页每页为 0.0035 USD,费用为 20 USD。
处理的总页数 = 5000000
前 100 万页每页价格 = 0.0035 USD * 1000000 = 3500 USD
接下来 400 万页每页价格 = 0.0014 美元 * 4000000 = 5600 USD
总计 = 3500 USD+ 5600 USD= 9100 USD

定价示例 10 – Analyze Expense API

假设您希望使用 Analyze Expense API 从 100000 张发票中提取数据。在美国西部(俄勒冈)区域的价格为 100 万页面每页 0.01 USD,您需要处理 100000 张发票。总费用将为 1000 USD。请参阅下面的计算: 

处理的总页面数 = 100000 

每页价格 = 0.01 USD 

每月总费用 = 0.01 USD * 100000 = 1000 USD

定价示例 11 – Analyze Expense API

假设您希望使用 Analyze Expense API 从 1500000 张发票中提取数据。在美国西部(俄勒冈)区域的价格为 100 万页面每页 0.01 USD,超过 100 万页后为每页 0.008 USD。总费用将为 14000 USD。请参阅下面的计算: 

处理的总页数 = 1500000 

每页价格 = 前 100 万页 0.01 USD,接下来 500000 页 0.008 USD 

每月总费用 = 0.01 USD * 1000000 + 0.008 USD * 500000 = 14000 USD

定价示例 12 – Analyze ID API

假设您希望使用 Analyze ID API 从 100000 个身份文档中提取信息。在美国西部(俄勒冈)区域的价格为 10 万页每页 0.025 USD,超过 10 万页后为每页 0.025 USD。总费用将为 2,500 USD。 

处理的总页面数 = 100000 

每页价格 = 0.025 USD 

每月总费用 = 0.025 USD * 100000 = 2500 USD

定价示例 13 – Analyze ID API

假设您希望使用 Analyze ID API 从 600000 个身份文档中提取信息。在美国西部(俄勒冈)区域的价格为 10 万页面每页 0.025 USD,超过 10 万页后为每页 0.01 USD。总费用将为 7500 USD。

处理的总页数 = 600000

每页价格 = 前 10 万页 0.025 USD,接下来 500000 页 0.01 USD

每月总费用 = 0.025 USD * 100000 + 0.01 USD * 500000 = 7500 USD

定价示例 14 – Analyze Lending API

假设您希望使用 Analyze Lending API 从 200000 页的抵押贷款文档中提取信息。美国西部(俄勒冈州)区域的价格为前 100 万页每页 0.07 USD。在您处理的 200000 页文档中,Analyze Lending 为其支持的文档类型提供了分类和提取功能,从而产生了 100000 页的分类和数据提取。100000 页的总费用将为 7000 USD。

处理的总页数 = 200000

分类和提取支持的总页数 = 100000 

每页价格 = 0.07 USD

每月总费用 = 0.07 USD * 100000 = 7000 USD

定价示例 15 – Analyze Lending API

假设您希望使用 Analyze Lending API 从 2000000 页的抵押贷款文档中提取信息。美国西部(俄勒冈州)区域的价格为前 100 万页每页 0.07 USD,100 万页后每页 0.055 USD。在您处理的 2000000 页文档中,Analyze Lending 为其支持的文档类型提供了分类和提取功能,从而产生了 1200000 页的分类和数据提取。1200000 页的总费用将为 81000 USD。

处理的总页数 = 2000000

分类和提取支持的总页数 = 1200000

每页价格 = 前 100 万页 0.07 USD,接下来 200000 页 0.0055 USD

每月总费用 = 0.07 USD * 1000000 + 0.055 USD * 200000 = 81000 USD

定价示例 16 - Analyze Document API – 布局和表格

您需要使用 Analyze Document API 从两百万页的财务报告中提取布局和表格。与表格功能相结合时,布局可以免费使用。美国西部(俄勒冈州)区域表格功能的定价为:每月前 100 万页为每页 0.015 USD,一个月内超过 100 万页以外的部分为每页 0.010 USD。

处理的总页数 = 2000000 页

前 100 万页的价格 = 0.015 USD * 100 万 = 15000 USD

接下来 100 万页的价格 = 0.010 USD * 1,00 万 = 10000 USD

总费用 = 25000 USD

定价示例 17 — Analyze Document API — 自定义查询

您需要使用自定义查询从 500 万页内容中提取数据。美国西部(俄勒冈州)区域的定价为:每月前 100 万页为每页 0.025 USD,一个月内超过 100 万页以外的部分为每页 0.015 USD。

处理的总页面数 = 500 万页

前 100 万页的价格 = 0.025 USD * 100 万 = 25000 USD

接下来 400 万页的价格 = 0.015 USD * 400 万 = 60000 USD

总费用 = 85000 USD

定价示例 18 — 分析文档 API — 预训练表单和自定义查询

您需要使用预训练表单和自定义查询从 200 万页内容中提取数据点。美国西部(俄勒冈州)区域的定价为:每月前 100 万页为每页 0.065 USD,一个月内超过 100 万页以外的部分为每页 0.050 USD。

处理的总页数 = 2000000 页

前 100 万页的价格 = 0.065 USD * 100 万 = 65000 USD

接下来 100 万页的价格 = 0.050 USD * 100 万 = 50000 USD

总费用 = 115000 USD

查看 Amazon Textract 常见问题

了解更多有关 Amazon Textract 如何从几乎任何文档中提取文本和结构化数据的信息。

了解更多 
注册免费账户

立即享受 AWS Free Tier。 

注册 
开始在控制台中构建

在 AWS 管理控制台中,使用 Amazon Textract 开始构建。

注册