Amazon Textract 是一種機器學習 (ML) 服務,該服務可使用光學字元辨識 (OCR) 自動從掃描的文件 (如 PDF) 中擷取文本、手寫文字和資料。使用 Amazon Textract,您只需按實際用量付費。沒有最低費用,也沒有前期承諾。Amazon Textract 僅對處理的頁面收費,無論您擷取文字、帶表格的文字和/或表單資料。Amazon Textract 頁面和可接受用途的額外詳細資訊,請參閱常見問答集

Amazon Textract 擁有四種 API:Detect Document Text API、Analyze Document API、Analyze Expense API 和 Analyze ID API。

Detect Document Text API:使用光學字元辨識 (OCR) 技術,從文件擷取文字和手寫文字。在美國西部 (奧勒岡) 區域,前 100 萬頁每頁支付 0.0015 USD,超過 100 萬頁每頁支付 0.0006 USD。

Analyze Document API 具有兩種功能、表單和表格,各有不同的定價等級。

  • 用於表單的 Analyze Document API 使用 OCR 技術,從文件擷取文字和手寫文字。它還會擷取鍵值對等資料 (例如,「名字」和有關聯的值:“Jane Smith”)。在美國西部 (奧勒岡) 區域,前 100 萬頁每頁支付 0.05 USD,超過 100 萬頁每頁支付 0.04 USD。
  • 用於表格的 Analyze Document API 使用 OCR 技術,從文件擷取文字和手寫文字。它還會擷取以欄和列組織整理的表格式或表格資料。在美國西部 (奧勒岡) 區域,前 100 萬頁每頁支付 0.015 USD,超過 100 萬頁每頁支付 0.01 USD。
 
Analyze Expense API 從發票和收據中擷取資料,例如發票 ID、發票號、發票編號和關聯值 12345。Amazon Textract 將這些不同的術語識別為發票 ID,並將相應的值識別為 12345,以及啟用常見欄位的標準分類法。在美國西部 (奧勒岡) 區域,前 100 萬頁每頁支付 0.01 USD,超過 100 萬頁每頁支付 0.008 USD。
 
Analyze ID API 使用 ML 來了解身分文件的相關內容,例如美國護照、駕照和其他 ID。您可以自動擷取到期日期、出生日期等特定資訊,也可以智慧地識別並擷取姓名、地址等隱含資訊。
 

免費方案

Amazon Textract 是 AWS 免費方案的一部分,您可以免費開始使用。免費方案持續三個月,AWS 新客戶每個月可以使用 Detect Document Text API 分析多達 1,000 個頁面,且每個月能使用 Analyze Document API、Analyze Expense API 或 Analyze ID API 來分析多達 100 個頁面。

Amazon Textract API 定價

Detect Document Text API (OCR)


具表格之頁面的 Analyze Document API

*表格係指以視覺化方式整理成直欄和橫列的相關資料集。例如,追蹤工廠每日輸出的操作日誌。


具表單之頁面的 Analyze Document API

*表單係指正好在同一頁的獨立金鑰和值的集合 (例如 W2)。


具表格和表單之頁面的 Analyze Document API


Analyze Expense API 用於發票和收據

Analyze ID API

超出免費方案額度的定價範例

定價範例 1 - Detect Document Text API

假設您想要使用 Detect Document Text API,從 100,000 頁研究報告中擷取文字。美國西部 (奧勒岡) 區域前 100 萬頁的每頁定價為 0.0015 USD,因此處理 100,000 頁的每月總成本為 150 USD。

處理的總頁數 = 100,000

每頁價格 = 0.0015 USD

每月總費用 = 0.0015 USD*100,000 = 150 USD

定價範例 2 - Detect Document Text API

假設您想要使用 Detect Document Text API,從 200 萬頁研究報告中擷取文字。美國西部 (奧勒岡) 區域前 100 萬頁的每頁定價為 0.0015 USD,100 萬頁後的定價為 0.0006 USD,因此處理 200 萬頁的總成本為 2,100 USD。

處理的總頁數 = 2,000,000

每頁價格 = 前 100 萬頁 0.0015 USD 而 100 萬頁後為 0.0006 USD

每月總費用 = 0.0015 USD*1,000,000 + 0.0006 USD * 1,000,000 = 1,500 USD + 600 USD = 2,100 USD

定價範例 3 - Analyze Document API – 表單和表格

假設您想要使用 Analyze Document API,從 5,000 頁稅務表單中擷取文字和結構化資料。 美國西部 (奧勒岡) 區域含表格的 100 百萬頁每頁定價為 0.015 USD,含表單定價為 0.05 USD,共計 325 USD。請參閱以下計算:

處理的總頁數 = 5,000 頁

含表格的頁面價格 = 0.015 USD

含表單的頁面價格 (鍵值組) = 0.05 USD

總費用 = 0.015 USD*5,000 + 0.05 USD *5,000 = 75 USD + 250 USD = 325 USD

定價範例 4 - Analyze Document API – 表單和表格

假設您想要使用 Analyze Document API,從 200 萬頁稅務表單中擷取文字、表單和表格。美國西部 (奧勒岡) 區域含表格的 100 百萬頁每頁定價為 0.015 USD,100 百萬頁後每頁定價為 0.01 USD。含表單的 100 百萬頁每頁定價 0.05 USD,100 百萬頁後每頁定價 0.04 USD。總費用為 115,000 USD。

處理的總頁數 = 2,000,000 頁

含表單 (鍵值組) 頁面價格 = 前 100 萬頁 0.05 USD,後 100 萬頁為 0.04 USD

總費用 = 0.015 USD*1,000,000 + 0.01 USD*1,000,000 + 0.05 USD*1,000,000 + 0.04 USD*1,000,000 = 15,000 USD + 10,000 USD + 50,000 + 40,000 = 115,000 USD

定價範例 5 - Analyze Expense API

假設您想要使用 Analyze Expense API 從 100,000 張發票中擷取資料。美國西部 (奧勒岡) 區域 100 百萬頁每頁定價為 0.01 USD,且您處理了 100,000 張發票。總費用為 1,000 USD。

處理的總頁數 = 100,000

每頁價格 = 0.01 USD

每月總費用 = 0.01 USD*100,000 = 1,000 USD

定價範例 6 - Analyze Expense API

假設您想要使用 Analyze Expense API 從 150 萬張發票中擷取資料。美國西部 (奧勒岡) 區域 100 百萬頁每頁定價為 0.01 USD,100 百萬頁後每頁定價為 0.008 USD。總費用為 14,000 USD。

處理的總頁數 = 1,500,000

每頁價格 = 前 100 百萬頁 0.01 USD,後 500,000 頁 0.008 USD

每月總費用 = 0.01 USD * 1,000,000 + 0.008 USD * 500,000 = 14,000 USD

定價範例 7 – Analyze ID API

假設您想要使用 Analyze ID API 從 100,000 個身分文件中擷取資訊。美國西部 (奧勒岡) 區域 100,000 頁每頁定價為 0.025 USD (100,000 頁以內)。總費用為 2,500 USD。

處理的總頁數 = 100,000

每頁價格 = 0.025 USD

每月總費用 = 0.025 USD * 100,000 = 2,500 USD

定價範例 8 – Analyze ID API

假設您想要使用 Analyze ID API 從 600,000 個身分文件中擷取資訊。美國西部 (奧勒岡) 區域 100,000 頁每頁定價為 0.025 USD,100,000 頁後每頁定價為 0.01 USD。總費用為 17,500 USD。

處理的總頁數 = 600,000

每頁價格 = 前 100,000 頁 0.025 USD,後 500,000 頁 0.01 USD

每月總費用 = 0.025 USD * 100,000 + 0.01 USD * 500,000 = 7,500 USD

Standard Product Icons (Features) Squid Ink
查看 Amazon Textract 常見問答集

進一步了解 Amazon Textract 如何從幾乎任何文件中,擷取文字和結構化資料。

進一步了解 
Sign up for a free account
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
Standard Product Icons (Start Building) Squid Ink
開始在主控台進行建置

開始在 AWS 管理主控台使用 Amazon Textract 進行建置。

註冊