Amazon Textract 是一种机器学习(ML)服务,从扫描的文档(如 PDF)中自动提取文本、手写内容和数据。它不是简单的光学字符识别技术(OCR),而是可以识别、理解并提取表单和表格中的数据。使用 Amazon Textract 时,您只需按实际用量付费。既没有最低费用,也无需预先承诺。Amazon Textract 仅对处理的页面收费,无论您是提取文本、带表格的文本、表单数据、查询还是处理发票和身份文档。 有关页面和可接受的 Amazon Textract 用途,请参阅常见问题。
Amazon Textract 有五种不同的 API:Detect Document Text API、Analyze Document API、Analyze Expense API、Analyze ID API 和 Analyze Lending API。
Detect Document Text API 使用 OCR 技术从文档中提取文本和手写内容。
Analyze Document API 有四个功能:表单、表格、查询和签名。您可以灵活调用表单、表格、查询和签名的任意组合。
- Analyze Document API for Forms 提取诸如键值对(“名字”和关联值,如“Jane Smith”)之类的数据。它还使用 OCR 技术从文档中提取所有文本和手写内容。
- Analyze Document API for Tables 提取按列和行组织的表格数据。它还使用 OCR 技术从文档中提取所有文本和手写内容。
- Analyze Document API for Queries 为您提供了从文档中指定所需信息(例如,”客户名称是什么?”)以及接收该数据(例如,“Jane Doe”)作为响应的一部分的灵活性。您不需要担心文档中数据的结构,也不需要担心数据在不同格式和文档版本之间的布局如何变化。它还使用 OCR 技术从文档中提取所有文本和手写内容。
- 适用于自定义查询的 Analyze Document API 使您能够为特定于业务的文档调用自定义查询功能。您可以使用 AWS 管理控制台训练适配器,并使用 Analyze Document API 请求中的适配器标识符来使用自定义查询。
- Analyze Document API for Signatures 能够检测任何文档或图像上的手写签名、电子签名和首字母缩写。它还使用 OCR 技术从文档中提取所有文本和手写内容。
请求自定义报价
对于大容量使用案例,请联系我们的销售团队以请求自订价格提案。
免费套餐
作为 AWS 免费套餐的一部分,您可以免费开始使用 Amazon Textract。免费套餐将持续三个月,新的 AWS 客户最多可以分析:
Detect Document Text API:每个月 1000 个页面
Analyze Document API:
- 仅使用签名功能时,每月 1000 个页面
- 使用表单、表格和布局功能时,每月 100 页
- 每月 100 页,用于查询、表单 + 查询、表格 + 查询、表单 + 表格 + 查询
- 自定义查询没有免费套餐
Analyze Expense API:每月 100 个页面
Analyze ID API:每月 100 个页面
Analyze Lending API:每月 2000 个页面
Amazon Textract API 定价
预训练功能
*Analyze Document API 输出包含有 OCR,无论所选的功能类型如何
*Analyze Expense 和 Analyze ID API 的输出中包含 OCR
预训练 + 自定义功能
超出免费套餐后的定价示例
定价示例 1 - Detect Document Text API
假设您希望使用 Detect Document Text API 从 100000 页研究报告中提取文本。在美国西部(俄勒冈)区域的每页价格为前 100 万页 0.0015 USD,成本为 150 USD。
处理的总页数 = 100000
每页价格 = 0.0015 USD
每月总费用 = 0.0015 USD * 100000 = 150 USD
定价示例 2 - Detect Document Text API
假设您希望使用 Detect Document Text API 从 200 万页研究报告中提取文本。在美国西部(俄勒冈)区域的每页价格为前 100 万页 0.0015 USD,超过 100 万页后为 0.0006 USD,因此处理 200 万页的总费用将为 2100 USD。
处理的总页数 = 2000000
每页的价格 = 前 100 万页 0.0015 USD 和 100 万页以后每页 0.0006 USD
每月总费用 = 0.0015 USD * 1000000 + 0.0006 USD * 1000000 = 1500 USD + 600 USD = 2100 USD
定价示例 3 - Analyze Document API – 表单和表格
假设您希望使用 Analyze Document API 从 5000 页的税务表单中提取文本和结构化的数据。在美国西部(俄勒冈)区域的价格为 100 万含表格的页面每页 0.015 USD,含表单的页面每页 0.05 USD,总费计 325 USD。
处理的总页面数 = 5000 页
含表格的页面价格 = 0.015 USD
含表单(键-值对)的页面价格 = 0.05 USD
总费用 = 0.015 USD * 5000 + 0.05 USD * 5000 = 75 USD + 250 USD = 325 USD
定价示例 4 - Analyze Document API – 表单和表格
假设您想使用 Analyze Document API 从 200 万页纳税申报表中提取文本、表单和表格。在美国西部(俄勒冈)区域的价格为 100 万含表格的页面每页 0.015 USD,超过 100 万页后为每页 0.01 USD。含表单的页面价格为前 100 万页每页 0.05 USD,100 万页之后每页 0.04 USD。总费用将为 115000 USD。
处理的总页数 = 2000000 页
含表单(键-值对)的页面价格 = 前 100 万页每页 0.05 USD,接下来 100 万页每页 0.04 USD
总费用 = 0.015 USD * 1000000 + 0.01 USD * 1000000 + 0.05 USD * 1000000 + 0.04 USD * 1000000 = 15000 USD + 10000 USD + 50000 + 40000 = 115000 USD
定价示例 5 - Analyze Document API - 查询
假设您希望使用 Analyze Document API 从 5000 页的抵押贷款表单中提取文本。您还希望通过查询从每个页面中提取 10 个特定的数据点。在美国西部(俄勒冈)区域的价格为 100 万个页面每页 0.015 USD,总费用 75 USD。
处理的总页面数 = 5000 页
使用查询的每个页面价格 = 0.015 USD
总费用 = 0.015 USD * 5000 = 75 USD
定价示例 6 – Analyze Document API – 表单以及表格和查询
假设您想使用 Analyze Document API 从 200 万页工资条中提取文本、表单和表格。您还希望通过查询从每个页面中提取 10 个特定的数据点。在美国西部(俄勒冈)区域的价格为 100 万含表格、表单和查询的页面每页 0.070 USD,超过 100 万页后为每页 0.055 USD。总费用将为 125000 USD。
处理的总页数 = 2000000 页
含表格、表单和查询的页面价格 = 前 100 万页每页 0.070 USD,接下来 100 万页每页 0.055 USD
总费用 = 0.070 USD * 1000000 + 0.055 USD * 1000000 = 70000 USD + 55000 USD = 125000 USD
定价示例 7 – Analyze Document API – 表单和查询
假设您希望使用 Analyze Document API 从 5000 页的税务表单中提取文本和表格数据。您还希望通过查询从每个页面中提取 10 个特定的数据点。在美国西部(俄勒冈)区域的价格为 100 万含表格和查询的页面每页 0.020 USD,超过 100 万页后为每页 0.015 USD。总费用将为 100 USD。
处理的总页面数 = 5000 页
含表格和查询的页面的价格 = 0.020 USD
总费用 = 0.020 USD * 5000 = 100 USD
定价示例 8 - Analyze Document API – 签名
假设您要检测签名并使用 Analyze Document
API – 签名功能类型从 10 万页抵押文档中提取原始文本。美国西部(俄勒冈州)区域的价格为前 100 万页每页 0.0035 USD,费用为
350 USD。
处理的总页面数 = 100000
每页价格 = 0.0035 USD
每月总费用 = 0.0035 USD * 100000 = 350 USD
定价示例 9 - Analyze Document API – 签名
假设您要检测签名并使用 Analyze Document API
API – 签名功能类型从 500 万页的抵押文档中提取原始文本。美国西部(俄勒冈州)区域的价格为前 100 万页每页为 0.0035 USD,费用为 20 USD。
处理的总页数 = 5000000
前 100 万页每页价格 = 0.0035 USD * 1000000 = 3500 USD
接下来 400 万页每页价格 = 0.0014 美元 * 4000000 = 5600 USD
总计 = 3500 USD+ 5600 USD= 9100 USD
定价示例 10 – Analyze Expense API
假设您希望使用 Analyze Expense API 从 100000 张发票中提取数据。在美国西部(俄勒冈)区域的价格为 100 万页面每页 0.01 USD,您需要处理 100000 张发票。总费用将为 1000 USD。请参阅下面的计算:
处理的总页面数 = 100000
每页价格 = 0.01 USD
每月总费用 = 0.01 USD * 100000 = 1000 USD
定价示例 11 – Analyze Expense API
假设您希望使用 Analyze Expense API 从 1500000 张发票中提取数据。在美国西部(俄勒冈)区域的价格为 100 万页面每页 0.01 USD,超过 100 万页后为每页 0.008 USD。总费用将为 14000 USD。请参阅下面的计算:
处理的总页数 = 1500000
每页价格 = 前 100 万页 0.01 USD,接下来 500000 页 0.008 USD
每月总费用 = 0.01 USD * 1000000 + 0.008 USD * 500000 = 14000 USD
定价示例 12 – Analyze ID API
假设您希望使用 Analyze ID API 从 100000 个身份文档中提取信息。在美国西部(俄勒冈)区域的价格为 10 万页每页 0.025 USD,超过 10 万页后为每页 0.025 USD。总费用将为 2,500 USD。
处理的总页面数 = 100000
每页价格 = 0.025 USD
每月总费用 = 0.025 USD * 100000 = 2500 USD
定价示例 13 – Analyze ID API
假设您希望使用 Analyze ID API 从 600000 个身份文档中提取信息。在美国西部(俄勒冈)区域的价格为 10 万页面每页 0.025 USD,超过 10 万页后为每页 0.01 USD。总费用将为 7500 USD。
处理的总页数 = 600000
每页价格 = 前 10 万页 0.025 USD,接下来 500000 页 0.01 USD
每月总费用 = 0.025 USD * 100000 + 0.01 USD * 500000 = 7500 USD
定价示例 14 – Analyze Lending API
假设您希望使用 Analyze Lending API 从 200000 页的抵押贷款文档中提取信息。美国西部(俄勒冈州)区域的价格为前 100 万页每页 0.07 USD。在您处理的 200000 页文档中,Analyze Lending 为其支持的文档类型提供了分类和提取功能,从而产生了 100000 页的分类和数据提取。100000 页的总费用将为 7000 USD。
处理的总页数 = 200000
分类和提取支持的总页数 = 100000
每页价格 = 0.07 USD
每月总费用 = 0.07 USD * 100000 = 7000 USD
定价示例 15 – Analyze Lending API
假设您希望使用 Analyze Lending API 从 2000000 页的抵押贷款文档中提取信息。美国西部(俄勒冈州)区域的价格为前 100 万页每页 0.07 USD,100 万页后每页 0.055 USD。在您处理的 2000000 页文档中,Analyze Lending 为其支持的文档类型提供了分类和提取功能,从而产生了 1200000 页的分类和数据提取。1200000 页的总费用将为 81000 USD。
处理的总页数 = 2000000
分类和提取支持的总页数 = 1200000
每页价格 = 前 100 万页 0.07 USD,接下来 200000 页 0.0055 USD
每月总费用 = 0.07 USD * 1000000 + 0.055 USD * 200000 = 81000 USD
定价示例 16 - Analyze Document API – 布局和表格
您需要使用 Analyze Document API 从两百万页的财务报告中提取布局和表格。与表格功能相结合时,布局可以免费使用。美国西部(俄勒冈州)区域表格功能的定价为:每月前 100 万页为每页 0.015 USD,一个月内超过 100 万页以外的部分为每页 0.010 USD。
处理的总页数 = 2000000 页
前 100 万页的价格 = 0.015 USD * 100 万 = 15000 USD
接下来 100 万页的价格 = 0.010 USD * 1,00 万 = 10000 USD
总费用 = 25000 USD
定价示例 17 — Analyze Document API — 自定义查询
您需要使用自定义查询从 500 万页内容中提取数据。美国西部(俄勒冈州)区域的定价为:每月前 100 万页为每页 0.025 USD,一个月内超过 100 万页以外的部分为每页 0.015 USD。
处理的总页面数 = 500 万页
前 100 万页的价格 = 0.025 USD * 100 万 = 25000 USD
接下来 400 万页的价格 = 0.015 USD * 400 万 = 60000 USD
总费用 = 85000 USD
定价示例 18 — 分析文档 API — 预训练表单和自定义查询
您需要使用预训练表单和自定义查询从 200 万页内容中提取数据点。美国西部(俄勒冈州)区域的定价为:每月前 100 万页为每页 0.065 USD,一个月内超过 100 万页以外的部分为每页 0.050 USD。
处理的总页数 = 2000000 页
前 100 万页的价格 = 0.065 USD * 100 万 = 65000 USD
接下来 100 万页的价格 = 0.050 USD * 100 万 = 50000 USD
总费用 = 115000 USD