Amazon Textract

從幾乎任何文件輕鬆地擷取文字和資料
Amazon Textract 是一種服務,可從掃描的文件中自動擷取文字和資料。Amazon Textract 不僅僅是簡單的光學字元辨識 (OCR),還能識別表單中的欄位內容以及表格中存放的資訊。

如今,許多公司透過緩慢且昂貴的手動資料輸入,或需要手動自訂或設定的簡單光學字元識別 (OCR) 軟體,從文件和表單中擷取資料。根據每個文件和表單的規則和工作流程,表單每次變更或處理多個表單時,通常需要進行硬編碼和更新每次變更。若表單偏離規則,則輸出通常會混亂且無法使用。

Amazon Textract 使用機器學習可立即讀取幾乎任何類型的文件,以準確地擷取文字和資料,無須再手動檢閱或自訂程式碼,從而能夠應對這些挑戰。您可以使用 Textract 快速地自動化文件工作流程,以便在幾小時內處理數百萬個文件頁面。擷取資訊後,您可以在商業應用程式內對其執行操作,以啟動執行貸款申請或醫療索賠處理等後續步驟。此外,您可以建立智慧搜尋索引、建構自動核准工作流程,以及透過標記可能需要修改的資料,使用文件存檔規則更佳地保持合規狀態。

Amazon Textract 簡介 (3:04)

優勢

快速、準確地擷取資料

Amazon Textract 讓您可以輕鬆、快速、準確地從文件、表單和表格中提取資料。Amazon Textract 會自動偵測文件的版面和頁面上的關鍵元素、理解任何內嵌表單或表格中的資料關係,以及擷取上下文的所有內容。這意味著您可以立即在應用程式中使用擷取的數據,也可以將其儲存在資料庫中,而無須在其間編寫很多複雜的代碼。



無須維護代碼或範本

Amazon Textract 經過預先訓練的機器學習模型無須編寫資料擷取代碼,因為其已接受幾乎各行各業數千萬個文件的訓練,包括合約、稅務文件、銷售訂單、註冊表單、福利申請、保險索賠、保單文件等。您不再需要為可能收到的每個文件或表單維護代碼,也不必擔心版面配置隨時間變化。

降低文件處理成本

Amazon Textract 以極低的成本提供 OCR 和結構化資料擷取 (表單和表格),您僅需按實際用量付費。沒有前期承諾,也不用簽訂長期合約。您可以使用 Amazon Textract 的文本擷取 API,輕鬆處理數百萬個文件。

使用案例

建立智慧搜尋索引

從文件中擷取結構化資料並建立智慧索引,讓您能夠快速搜尋數百萬份財務報表。例如,一間抵押貸款公司可以使用 Amazon Textract 在幾小時內處理數百萬份掃描的貸款申請,並將擷取的資料在 Amazon Elasticsearch 中建立索引。這讓他們能夠建立搜尋體驗,例如「搜尋申請人姓名為 John Doe 的貸款申請」或「搜尋利率為 2% 的合約」。

建立自動化的文件處理工作流程

Amazon Textract 可以提供自動處理表單所需的輸入,而無須人工干預。例如,銀行可以使用 Amazon Textract 自動執行貸款申請。該文件中包含的資訊可用於啟動審批貸款要進行的所有必要的背景和信用查核,以便客戶獲得其申請的即時結果,而不必等待數天的時間進行人工審核和驗證。

確保文件存檔的合規性

由於 Amazon Textract 可自動識別資料類型和表單標籤,因此可輕鬆確保符合資訊控制要求。例如,保險公司可以使用 Amazon Textract 來提供工作流程,可透過自動識別需要保護的重要索引鍵/值組,來自動編輯個人可識別資訊 (PII) 以供審核,然後再存檔索賠表單。

客戶成功案例

600x400-cambia-health-solutions_logo

Cambia Health Solutions 是一間全面的健康解決方案公司,也是六個區域健康計劃的母公司,其中包括 Regence,該公司在奧勒岡州、愛達荷州、猶他州和華盛頓州為 260 萬會員提供服務。

「過去 100 年來,Cambia 一直致力於改善人們及其家人的醫療保健。為協助我們實現這一目標,我們一直在評估新的創新方式和機遇,以最佳化照護協調。其中一個關注領域是精簡耗時費力的行政程序。我們很高興探索 Amazon Textract,它可協助我們以準確、高效的方式,自動化從紙質表單中擷取有價值資料的程序。資料科學、人工智慧和以人為本的方法強強聯手,是我們實現變革醫療保健系統之使命的關鍵。」

Faraz Shafiq,人工智慧長 - Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare 是一間領先的獨立醫療技術公司,專注於提供資料和分析驅動的解決方案,以改善美國醫療系統中的臨床、財務和患者參與度。

「在 Change Healthcare,我們堅信,透過改善財務和行政決策的及時性和品質,我們能夠讓所有人都能負擔得起和獲得醫療保健。機器學習技術的強大功能可從我們的資料中了解更多資訊,從而實現這一目標。但是,發揮這些資訊的潛在作用通常很困難,因為它被表格和表單孤立起來,而傳統的光學字元識別無法對其進行分析。 Amazon Textract 除了擷取文字,還能擷取結構化資料,從而進一步提高了文件理解的能力。現在,隨著該服務符合 HIPAA 的要求,我們將能夠從數百萬個文件中釋放資訊,並為患者、付款人和服務提供者創造更大價值。」

Nick Giannasi,執行副總裁兼人工智慧長 - Change Healthcare


CD_2018_Primary_Logo_w_TM

ClearDATA 的創新解決方案和服務平台可保護客戶免受資料隱私權風險的影響,協助客戶改善其資料管理,並擴展其醫療保健 IT 基礎架構,從而讓業界能夠專注於透過改善每天的醫療保健服務,來提升醫療保健水準。

「很高興看到 AWS 將 Textract 新增至其 HIPAA 合資格服務清單中,這項光學字元識別服務由機器學習提供支援。付款人和服務提供者之間共用的許多醫療資料都被鎖在影像檔案中,例如 PDF。醫療保健組織現在可以使用 Amazon Textract 服務,從之前電腦不可讀的檔案中擷取醫療資料,而不必手動處理此類資料。如此一來,就能將這些資料與其電子病歷或其他雲端技術整合,例如 Amazon Comprehend Medical,可識別資料集中受保護的健康資訊。從而能夠更進一步地利用這些新興技術,來改善對資料的存取,獲得更好的洞見,降低成本,以及改善患者和會員的體驗。」

Matt Ferrari,技術長 - ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
查看 Amazon Textract 功能

探索更多 Amazon Textract 功能。

進一步了解 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
Product-Page_Standard-Icons_03_Start-Building_SqInk
開始在主控台進行建置

開始在 AWS 管理主控台使用 Amazon Textract 進行建置。

註冊