Amazon Textract

從幾乎任何文件輕鬆地擷取文字和資料
Amazon Textract 是一項全受管機器學習服務,可自動從掃描的文件中擷取文字和資料,不僅超越簡單的光學字元辨識 (OCR),還可以識別、理解和擷取表單和表格中的資料。

如今,許多公司透過手動資料輸入 (速度慢、成本高且容易出錯) 或需要手動設定 (每次表單變更為可用時都需要更新) 的簡單 OCR 軟體從掃描的文件 (例如 PDF、表單和表格) 中擷取資料。
 
為了克服這些手動程序,Textract 使用機器學習來立即讀取和處理任何類型的文件、準確地擷取文字、表單、表格和其他資料,而無需任何手動操作或自訂程式碼。

您可以使用 Textract 快速地自動化手動文件活動,以便在幾小時內處理數百萬個文件頁面。擷取資訊後,您可以在商業應用程式內對其執行操作,以啟動執行貸款申請、稅務文件、註冊表單或醫療索賠處理等後續步驟。此外,您可以建立智慧搜尋索引,或使用 Amazon Augmented AI 加入人工審查來檢閱細微差別或敏感資料。

優勢

快速準確地擷取結構化與非結構化資料

Amazon Textract 使用人工智能像人一樣「閱讀」文件,不僅擷取文字,也可擷取表格、表單和其他結構化資料,而無需進行設定、培訓或自訂程式碼。Amazon Textract 會自動偵測文件的版面和頁面上的關鍵元素、理解任何內嵌表單或表格中的資料關係,並擷取其上下文完整的所有內容。

超越簡單的光學字元辨識 (OCR)

Amazon Textract 使用 OCR 技術來識別表單標籤和值,並從表格中擷取資訊,而不以低成本破壞結構。您僅需按使用付費,沒有前期承諾,也不用簽訂長期合約。 

安全與合規

Textract 可用於需要遵循服務組織控制 (SOC)、國際標準化組織 (ISO)、PCI、HIPAA 和 GPDR 合規要求的工作負載。金融、醫療保健和其他產業的客戶可以深入洞見保護其客戶資料的安全程序和控制。此外,Textract 透過 AWS PrivateLink 支援 Amazon Virtual Private Cloud (Amazon VPC) 端點,讓客戶能夠從其 VPC 內部安全地發起對 Amazon Textract 的 API 叫用,並避免使用公共網際網路。

輕鬆實作人工審查

Amazon Textract 直接與 Amazon Augmented AI (Amazon A2I) 整合,因此您可以輕鬆對文件中擷取的文字實作人工審查。您可以內建人工審查來管理細微或敏感的工作流程,這些工作流程需要人工判斷以取得高可信度預測或持續稽核預測。

什麼是 Amazon Textract (1:49)

使用案例

建立智慧搜尋索引

從文件中擷取結構化資料並建立智慧索引,讓您能夠快速搜尋數百萬份財務報表。例如,一間抵押貸款公司可以使用 Amazon Textract 在幾小時內處理數百萬份掃描的貸款申請,並將擷取的資料在 Amazon Elasticsearch 中建立索引。這讓他們能夠建立搜尋體驗,例如「搜尋申請人姓名為 John Doe 的貸款申請」或「搜尋利率為 2% 的合約」。

建立自動化的文件處理工作流程

Amazon Textract 可以提供自動處理表單所需的輸入,而無須人工干預。例如,銀行可以使用 Amazon Textract 自動執行貸款申請。該文件中包含的資訊可用於啟動審批貸款要進行的所有必要的背景和信用查核,以便客戶獲得其申請的即時結果,而不必等待數天的時間進行人工審核和驗證。

確保文件存檔的合規性

由於 Amazon Textract 可自動識別資料類型和表單標籤,因此可輕鬆確保符合資訊控制要求。例如,保險公司可以使用 Amazon Textract 來提供工作流程,可透過自動識別需要保護的重要索引鍵/值組,來自動編輯個人可識別資訊 (PII) 以供審核,然後再存檔索賠表單。

客戶成功案例

change-healthcare-600x400

Change Healthcare 是一間領先的獨立醫療技術公司,專注於提供資料和分析驅動的解決方案,以改善美國醫療系統中的臨床、財務和患者參與度。

「在 Change Healthcare,我們堅信,透過改善財務和行政決策的及時性和品質,我們能夠讓所有人都能負擔得起和獲得醫療保健。機器學習技術的強大功能可從我們的資料中了解更多資訊,從而實現這一目標。但是,發揮這些資訊的潛在作用通常很困難,因為它被表格和表單孤立起來,而傳統的光學字元識別無法對其進行分析。Amazon Textract 除了擷取文字,還能擷取結構化資料,從而進一步提高了文件理解的能力。現在,隨著該服務符合 HIPAA 的要求,我們將能夠從數百萬個文件中釋放資訊,並為患者、付款人和服務提供者創造更大價值。」

Change Healthcare 執行副總裁兼人工智慧長 Nick Giannasi


filevine-600x400

Filevine 是法律專業人士的營運核心,包括雲端案例和事務管理、文件管理以及深度報告分析。自 2015 年推出以來,Filevine 專注於快速創新和屢獲殊榮的設計,在獨立評論網站上獲得最高評級。

「Filevine 每天都會處理數百萬事務和案例檔案。我們之所以選擇 Amazon Web Services,是因為我們想為客戶提供一流的文件搜尋解決方案。Amazon Textract 快速、準確且可擴展,可協助 Filevine 滿足世界上最大型、最複雜的法律組織的嚴格要求。有了 Filevine 和 Amazon,對於法律專業人士而言,諺語中所說的大海撈針變得從未如此簡單。」

Filevine 執行長 Ryan Anderson


CD_2018_Primary_Logo_w_TM

ClearDATA 的創新解決方案和服務平台可保護客戶免受資料隱私權風險的影響,協助客戶改善其資料管理,並擴展其醫療保健 IT 基礎架構,從而讓業界能夠專注於透過改善每天的醫療保健服務,來提升醫療保健水準。

「很高興看到 AWS 將 Textract 新增至其 HIPAA 合資格服務清單中,這項光學字元識別服務由機器學習提供支援。付款人和服務提供者之間共用的許多醫療資料都被鎖在影像檔案中,例如 PDF。醫療保健組織現在可以使用 Amazon Textract 服務,從之前電腦不可讀的檔案中擷取醫療資料,而不必手動處理此類資料。如此一來,就能將這些資料與其電子病歷或其他雲端技術整合,例如 Amazon Comprehend Medical,可識別資料集中受保護的健康資訊。從而能夠更進一步地利用這些新興技術,來改善對資料的存取,獲得更好的洞見,降低成本,以及改善患者和會員的體驗。」

Matt Ferrari,技術長 - ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
查看 Amazon Textract 功能

探索更多 Amazon Textract 功能。

進一步了解 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
註冊免費帳戶

立即存取 AWS 免費方案 

註冊 
Product-Page_Standard-Icons_03_Start-Building_SqInk
開始在主控台進行建置

開始在 AWS 管理主控台使用 Amazon Textract 進行建置。

註冊