Amazon Textract

從幾乎任何文件輕鬆地擷取印刷文字、手寫文字和資料
Amazon Textract 是一項全受管機器學習服務,可自動從掃描的文件中擷取印刷文字、手寫文字和其他資料,不僅超越簡單的光學字元辨識 (OCR),還可以識別、理解和擷取表單和表格中的資料。

如今,許多公司透過手動資料輸入 (速度慢、成本高且容易出錯) 或需要手動設定 (每次表單變更為可用時都需要更新) 的簡單 OCR 軟體從掃描的文件 (例如 PDF、表單和表格) 中擷取資料。
 
為了克服這些手動程序,Textract 使用機器學習來立即讀取和處理任何類型的文件、準確地擷取印刷文字、手寫文字、表單、表格和其他資料,而無需任何手動操作或自訂程式碼。

您可以使用 Textract 快速地自動化手動文件活動,以便在幾小時內處理數百萬個文件頁面。擷取資訊後,您可以在商業應用程式內對其執行操作,以啟動執行貸款申請、稅務文件、註冊表單或醫療索賠處理等後續步驟。此外,您可以建立智慧搜尋索引,或使用 Amazon Augmented AI 加入人工審查來檢閱細微差別或敏感資料。

優勢

快速準確地擷取結構化與非結構化資料

Amazon Textract 使用人工智能像人一樣「閱讀」文件,不僅擷取印刷文字和手寫文字,也可擷取表格、表單和其他結構化資料,而無需進行設定、培訓或自訂程式碼。Amazon Textract 會自動偵測文件的版面和頁面上的關鍵元素、理解任何內嵌表單或表格中的資料關係,並擷取其上下文完整的所有內容。

超越簡單的光學字元辨識 (OCR)

Amazon Textract 使用 OCR 技術來識別表單標籤和值,並從表格中擷取資訊,而不以低成本破壞結構。您僅需按使用付費,沒有前期承諾,也不用簽訂長期合約。 

安全與合規

Textract 遵守服務組織控制 (SOC)、國際標準化組織 (ISO) 以及 PCI、HIPAA 和 GDPR,這表示客戶可以深入了解保護客戶資料的安全程序與控制。此外,Textract 支援透過 AWS PrivateLink 和 KMS 的 Amazon Virtual Private Cloud (VPC) 端點,讓客戶能夠避開公用網路並加密自身資料。

輕鬆實作人工審查

Amazon Textract 直接與 Amazon Augmented AI (Amazon A2I) 整合,因此您可以輕鬆對文件中擷取的印刷文字和手寫文字實作人工審查。您可以內建人工審查來管理細微或敏感的工作流程,這些工作流程需要人工判斷以取得高可信度預測或持續稽核預測。

什麼是 Amazon Textract (1:49)

使用案例

建立智慧搜尋索引

從文件中擷取結構化資料並建立智慧索引,讓您能夠快速搜尋數百萬份財務報表。例如,一間抵押貸款公司可以使用 Amazon Textract 在幾小時內處理數百萬份掃描的貸款申請,並將擷取的資料在 Amazon Elasticsearch 中建立索引。這讓他們能夠建立搜尋體驗,例如「搜尋申請人姓名為 John Doe 的貸款申請」或「搜尋利率為 2% 的合約」。

建立自動化的文件處理工作流程

Amazon Textract 可以提供自動處理表單所需的輸入,而無須人工干預。例如,銀行可以使用 Amazon Textract 自動執行貸款申請。該文件中包含的資訊可用於啟動審批貸款要進行的所有必要的背景和信用查核,以便客戶獲得其申請的即時結果,而不必等待數天的時間進行人工審核和驗證。

確保文件存檔的合規性

由於 Amazon Textract 可自動識別資料類型和表單標籤,因此可輕鬆確保符合資訊控制要求。例如,保險公司可以使用 Amazon Textract 來提供工作流程,可透過自動識別需要保護的重要索引鍵/值組,來自動編輯個人可識別資訊 (PII) 以供審核,然後再存檔索賠表單。

客戶成功案例

machine leanring_kabbage logo

Kabbage 是一家資料和技術公司,為小型企業提供現今流解決方案,包括存取靈活的信貸額度、線上支付、現金流洞見和公司支票帳戶。

「Amazon Textract 協助我們支援 80% 的 PPP 申請者接受全自動借款體驗,將審核時間從數天縮短為 4 小時的 中等速度。該計劃結束時,按申請量計,我們成為全國第二大 PPP 借貸平台,超過了美國主要的銀行,為超過 297,000 家小型企業提供服務,並預計為全美提供 945,000 份工作。」

Kabbage 資料科學主管 Anthony Sabelli



change-healthcare-600x400

Change Healthcare 是一間領先的獨立醫療技術公司,專注於提供資料和分析驅動的解決方案,以改善美國醫療系統中的臨床、財務和患者參與度。

「在 Change Healthcare,我們堅信,透過改善財務和行政決策的及時性和品質,我們能夠讓所有人都能負擔得起和獲得醫療保健。機器學習技術的強大功能可從我們的資料中了解更多資訊,從而實現這一目標。但是,發揮這些資訊的潛在作用通常很困難,因為它被表格和表單孤立起來,而傳統的光學字元識別無法對其進行分析。Amazon Textract 除了擷取文字,還能擷取結構化資料,從而進一步提高了文件理解的能力。現在,隨著該服務符合 HIPAA 的要求,我們將能夠從數百萬個文件中釋放資訊,並為患者、付款人和服務提供者創造更大價值。」

Change Healthcare 執行副總裁兼人工智慧長 Nick Giannasi


filevine-600x400

Filevine 是法律專業人士的營運核心,包括雲端案例和事務管理、文件管理以及深度報告分析。自 2015 年推出以來,Filevine 專注於快速創新和屢獲殊榮的設計,在獨立評論網站上獲得最高評級。

「Filevine 每天都會處理數百萬事務和案例檔案。我們之所以選擇 Amazon Web Services,是因為我們想為客戶提供一流的文件搜尋解決方案。Amazon Textract 快速、準確且可擴展,可協助 Filevine 滿足世界上最大型、最複雜的法律組織的嚴格要求。有了 Filevine 和 Amazon,對於法律專業人士而言,諺語中所說的大海撈針變得從未如此簡單。」

Filevine 執行長 Ryan Anderson


Product-Page_Standard-Icons_01_Product-Features_SqInk
查看 Amazon Textract 功能

探索更多 Amazon Textract 功能。

進一步了解 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
Product-Page_Standard-Icons_03_Start-Building_SqInk
開始在主控台進行建置

開始在 AWS 管理主控台使用 Amazon Textract 進行建置。

註冊