Amazon Textract

從任何文件輕鬆地擷取印刷文字、手寫文字和資料

Amazon Textract 是一項機器學習服務,可自動從掃描的文件中擷取文字、手寫內容和資料,不僅超越簡單的光學字元辨識 (OCR),還可以識別、理解和擷取表單和表格中的資料。如今,許多公司從 PDF、影像、表格和表單掃描之類的文件中手動擷取資料,或者透過需要手動設定的簡單 OCR 軟體來擷取,而當表單變更時,該軟體通常需要重新設定。為了克服這些手動且昂貴的程序,Textract 使用機器學習來讀取和處理任何類型的文件、準確地擷取文字、手寫內容、表格和其他資料,而無需任何手動操作。無論是自動化貸款處理還是從發票和收據擷取資訊,您都可以快速自動化文件處理,並對擷取的資訊採取動作。Textract 可以在幾分鐘而非數小時或數天的時間內擷取資料。此外,您可以使用 Amazon Augmented AI 新增人工審查,以監督模型並執行敏感資料的審查。

1,000 頁免費

(使用 AWS 免費方案的每個月)

優勢

擷取結構化與非結構化資料

Amazon Textract 使用人工智能像人一樣閱讀,不僅可以擷取文字、版面配置,也可擷取表格、表單以及具有內容的結構化資料,而無需進行設定、培訓或自訂程式碼。

超越簡單的光學字元辨識 (OCR)

Amazon Textract 使用 OCR 技術來識別表單標籤和值,並從表格中擷取資訊,而不以低成本破壞結構。您僅需按使用付費,沒有前期承諾,也不用簽訂長期合約。

選擇資料安全與合規

Amazon Textract 遵守服務組織控制 (SOC)、國際標準化組織 (ISO) 以及 PCI、HIPAA 和 GDPR,這表示客戶可以深入了解保護客戶資料的安全程序與控制。此外,Textract 支援透過 AWS PrivateLink 和 KMS 的 Amazon Virtual Private Cloud (VPC) 端點,讓客戶能夠避開公用網路並加密自身資料。

輕鬆實作人工審查

Amazon Textract 直接與 Amazon Augmented AI (Amazon A2I) 整合,因此您可以輕鬆對文件中擷取的文字實作人工審查。您可以內建人工監督來管理細微或敏感的工作流程,這些工作流程需要人工判斷以取得高可信度預測或持續稽核預測。

使用案例

金融服務

金融服務

抵押貸款申請、W-2 發票等金融表格可能包含重要的業務資訊,例如抵押貸款利率、申請人姓名、發票總額和重要的稅務資訊,這些資訊需要進行擷取和分析。藉助 Amazon Textract,您可以在幾分鐘內從掃描的文件、PDF、包含表格和表單的影像中擷取資訊,並處理申請,從而為您的客戶提供快速回應。

醫療保健與生命科學

醫療保健與生命科學

Amazon Textract 可以掃描成千上萬的醫療保健和保險表格,從這些表格中擷取資訊,並在保持其原始內容的情況下,確保資訊有條理,從而免除您手動審查輸出的麻煩。透過從健康保險表格、保險索賠和預授權表格中擷取重要的患者資料,更好地為您的患者和保險公司服務。

公部門

公部門

處理政府相關表格,例如小企業貸款、聯邦稅務表格或商業申請,需要數千人工小時來擷取相關的重要資料。Amazon Textract 可以使用光學字元識別 (OCR),從這些文件中擷取所有資料,無論是掃描影像、PDF 還是掃描文件,都不在話下。Textract 不僅可以識別每個字元、單詞和字母,還可以高精準地識別表單欄位的內容和表格中存放的資訊。

客戶成功案例

Kabbage

Foresight Group 是一家戰略多元化的家族企業,為未來創造遺產。以航運、海上鑽井、港口和天然氣基礎設施為核心,以印度為重點的私募股權投資,該集團數十年來已發展成為一家全球企業集團。

我們想要在 SAP 中實現發票處理自動化。目前,我們手動處理發票,每張發票需要 15-20 分鐘。AP 團隊成員收取電子郵件附件,手動從發票擷取資料,並將所有資料輸入多多個會計系統。一開始我們對自動化持懷疑態度。但是,合作夥伴 InfraBeat 評估了幾種 OCR 解決方案。 決定使用 Amazon Textract,InfraBeat 提出了一個帶有 Amazon Textract 解決方案的 SAP IRPA,以實現高度準確性和對其邏輯的最小調整。在資料擷取方面,我們總是希望獲得高準確度,而 Amazon Textract 的結果超出了我們的預期,在許多不同的版面配置中保持一致,所有發票的準確度均為 90%。」 

Foresight Group 集團 IT

Change Healthcare

Change Healthcare 是一間領先的獨立醫療技術公司,專注於提供資料和分析驅動的解決方案,以改善美國醫療系統中的臨床、財務和患者參與度。

「在 Change Healthcare,我們堅信,透過改善財務和行政決策的及時性和品質,我們能夠讓所有人都能負擔得起和獲得醫療保健。機器學習技術的強大功能可從我們的資料中了解更多資訊,從而實現這一目標。但是,發揮這些資訊的潛在作用通常很困難,因為它被表格和表單孤立起來,而傳統的光學字元識別無法對其進行分析。Amazon Textract 除了擷取文字,還能擷取結構化資料,從而進一步提高了文件理解的能力。現在,隨著該服務符合 HIPAA 的要求,我們將能夠從數百萬個文件中釋放資訊,並為患者、付款人和服務提供者創造更大價值。」

Change Healthcare 執行副總裁兼人工智慧長 Nick Giannasi

Filevine

Filevine 是法律專業人士的營運核心,包括雲端案例和事務管理、文件管理以及深度報告分析。自 2015 年推出以來,Filevine 專注於快速創新和屢獲殊榮的設計,在獨立評論網站上獲得最高評級。

「Filevine 每天都會處理數百萬事務和案例檔案。我們之所以選擇 Amazon Web Services,是因為我們想為客戶提供一流的文件搜尋解決方案。Amazon Textract 快速、準確且可擴展,可協助 Filevine 滿足世界上最大型、最複雜的法律組織的嚴格要求。有了 Filevine 和 Amazon,對於法律專業人士而言,諺語中所說的大海撈針變得從未如此簡單。」

Filevine 執行長 Ryan Anderson

Intuit

Intuit 向全球約 5,000 萬的客戶供應各種創新財務管理解決方案,包括 TurboTax 和 QuickBooks。

「Intuit 的文件理解技術利用 AI,讓我們的消費者、小型企業和自雇客戶免於手動資料輸入。對於每年依賴 TurboTax 的數百萬美國人而言,這項技術讓他們免於從財務文件中輸入資料的繁瑣且耗時的任務,從而簡化了納稅申報。Textract 是 Intuit 文件理解功能的重要組成部分,透過在復雜財務表單的內容中分析文件,來提高資料擷取的準確性。」

AI-Intuit 副總裁 Krithika Swaminathan

Standard Product Icons (Features) Squid Ink
查看 Amazon Textract 功能

探索更多 Amazon Textract 功能。

進一步了解 
Sign up for a free account
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
Standard Product Icons (Start Building) Squid Ink
開始在主控台進行建置

開始在 AWS 管理主控台使用 Amazon Textract 進行建置。

註冊