何謂智慧型文件處理?

智慧型文件處理 (IDP) 是將從紙本文件或文件影像中的手動輸入資料的過程自動化,以整合其他數位業務流程。例如,考慮一個商業流程工作流程,低庫存時向供應商自動發出訂單。雖然流程為自動化,但供應商收到款項前,不會為任何訂單出貨。供應商透過電子郵件傳送發票,接著會計團隊在完成付款前手動輸入資料 — 開始了會造成瓶頸或錯誤的手動檢查點。反之,IDP 系統會自動擷取商業發票資料,並在會計系統中按所需格式輸入。可以使用文件處理,利用機器學習 (ML) 和各種人工智慧 (AI) 技術來使文件管理自動化。

閱讀有關機器學習的內容

閱讀有關人工智慧的內容

智慧型文件處理有什麼好處?

IDP 為企業提供一系列好處。以下是部分優勢。

可擴展性

人工文書處理可能導致人為失誤,降低業務效率。還造成一次可以處理多少文件的限制。使用 IDP 解決方案,可準確地大規模掃描文件。ML/AI 解決方案可無誤地處理文件。可藉由改善準確性和效率來管理大量的操作需求。

成本效益

文件處理和分析的自動化可降低開銷成本。這可自動執行對運作關鍵的任何重複性任務,並克服瓶頸,從而消除手動資料輸入和處理所產生的成本。您可以利用 IDP 來提高生產力並簡化整個業務運作的工作流程。

客戶滿意度

使用 IDP,可加快處理客戶文件。可使用 IDP 進行自動化任務,例如客戶引導、預訂和涉及文件的款項。聊天機器人可使用客戶文件中的資料,以更個性化的方式回應客戶查詢。加快為客戶提供答案和服務,增強客戶關係。

智慧型文件處理的使用案例有哪些?

智慧型文件處理對各行各業的企業都很有用。

醫療保健

IDP 改善醫療保健記錄的管理。醫療保健產業必須在與醫院或醫療機構的每個接觸點保存無瑕疵的患者記錄。醫療保健企業可使用 IDP 從患者記錄中擷取資料,並更好地組織醫療文件。醫療保險產業也可使用 IDP 來驗證索賠,並減少該領域的人工文書工作。

金融

金融部門可使用 IDP 來自動化費用管理和發票處理的各方面事務。企業可從費用、表單和業務收據中擷取資料來簡化費用報表生成。財務部門可快速且有效率地管理員工和承包商的款項。例如,IDP 解決方案可從財務文件中擷取數字,並對未來款項資料進行處理。 

法律

企業中的法律部門可使用 IDP 分析合約。法律團隊使用自然語言處理 (NLP) 來分析法律合約的條款和義務。可從法律文件和法院記錄中擷取資料,以建構更健全的法律案件。

物流

從事物流業務的企業需要追蹤貨件、運輸許可和其他重要文件。公司使用 IDP 處理文件,降低人為失誤而導致嚴重錯誤的機會。IDP 有助於資料擷取、驗證和分類,因此物流產業的公司可加快物流功能。

人力資源

人力資源 (HR) 代理人使用 IDP 從候選人簡歷中擷取重要資訊。IDP 系統可節省時間,並確保人力資源團隊專注於頂尖候選人之間的選擇。人力資源產業也可在管理薪資、休假分配和其他人力資源工作上使用 IDP。

下圖顯示 IDP 是如何從員工的薪資明細中擷取關鍵資訊,例如年初至今 (YTD) 的薪資總額和應得的病假時間。

智慧型文件處理中使用了哪些技術?

IDP 使用一系列技術來處理不同類型的文件。 

光學字元辨識

光學字元辨識 (OCR) 會將文字圖像轉換為機器可讀的文字格式。您可以使用 OCR 掃描紙本文件,並將其轉換為內含可搜尋文字資料的圖像。OCR 對文件處理至關重要,因為它將紙本表單、收據、發票、合約、法律文件等轉換為數位化文件。 

OCR 可分為數種類型,應用上也各有無不同:

  • 簡單的 OCR 軟體使用匹配演算法,將文字影像和文字與字體影像模式模板進行比較
  • 智慧字元辨識(ICR)軟體使用 ML 軟體,處理不同的影像屬性(例如曲線和線條)來處理文字
  • 智慧單詞辨識使用與 ICR 類似原則,但專注於處理整個單詞,而非處理個別字符
  • 光學標記辨識使用匹配演算法來辨別文字系統、標識和浮水印

閱讀有關 OCR 的內容

自然語言處理

NLP 是一種 ML 技術,可讓電腦進行分析,解釋和理解人類語言。NLP 軟體處理文字和語音資料,以分析情緒、內容或意圖。NLP 使用一系列技術(包括 ML、計算語言學和深度學習模型)來處理人類語言。以下是部分技術:

  • 計算語言學涉及語義學和語法分析,以創建捕捉人類語言本質的框架
  • ML 技術使 NLP 模型可改善對人類演說中隱喻、文句結構變化、語法、口語、諷刺和其他元素的理解
  • 深度學習神經網路使電腦能夠識別,分類和辨別樣本資料中的複雜模式

在處理非結構性文件和非結構性資料(例如即時錄製或人類演說)時,NLP 特別好用。

閱讀有關自然語言處理的內容

閱讀有關深度學習的內容

閱讀有關神經網路的內容

機器人流程自動化

機器人流程自動化 (RPA) 是一種技術形式,促進建構和部署軟體來自動化人類行為。可以藉由 RPA 軟體自動化業務工作流程。例如,使用者可以記錄處理文件的方式。然後,RPA 軟體重複相同步驟,不需要人工文書處理工作。可以藉由 RPA 自動化任何流程,從資料擷取到資料摘錄等等。

智慧型文件處理是如何運作的?

IDP 可以解譯、分類及擷取各類文件中的資料,從結構化資料到電子郵件或報告等非結構化文字均包含在內。以下是智慧文件處理程序的簡要概述。

文件分類

IDP 的第一步是擷取和分類文件。這涉及將紙本和數位文件匯入系統。文件處理工具運用 AI 來識別和分類不同類型的掃描文件,例如發票、採購單或法律合約。分類對於確立各類型文件的後續處理步驟至關重要。

資料擷取

分類完成後,系統會從文件中擷取相關資料。借助 OCR 和 NLP 技術,IDP 系統可準確識別特定資訊,例如日期、金額或名稱。

擷取後,系統還會執行資料驗證以確保準確性。例如,系統可能會交叉比對擷取的資料與現資料庫,或使用預先定義的規則來檢查錯誤。 

資料處理

驗證後,系統會根據其目的來處理擷取的資料。例如,發票資料可能會被發送至付款處理,而合約細節則可能會發送至法律平台。IDP 系統與其他業務系統(如 ERP 和 CRM)整合,以實現無縫的資料流程,並根據已處理的資料自動執行相應動作。 

持續學習

IDP 系統的一個關鍵特點在於它們能夠隨著時間的推移學習精進。透過使用 ML 演算法,系統可從先前的錯誤中學習,並適應文件格式的變化以提高準確性。持續學習程序可確保系統不會隨著業務需求和文件類型的演變而失去效用。

報告和分析

IDP 系統可以追蹤處理時間、錯誤率和輸送量量等指標。業務分析可進一步處理指標並衍生洞察,協助識別瓶頸、改善工作流程及做出資料導向決策,以提升整體效率。

AWS 如何協助智慧文件處理?

Amazon Web Services (AWS) 提供兩種支援 IDP 要求的服務。

Amazon Textract 可自動從任何文件中輕鬆擷取手寫內容、版面配置元素、印刷文字和資料。Amazon Textract 使用 ML 來讀取、處理和理解所有類型的文件,無需人為介入操作。使用 Amazon Textract,您可以:

  • 擷取業務文件中的重要資訊,且準確性極高
  • 擴展文件處理管道,以便靈活因應市場需求
  • 在符合合規標準的安全環境中自動化資料處理

Amazon Comprehend 是一項 NLP 服務,它運用機器學習 (ML) 技術發現文字中有價值的洞察和關聯性。它是全受管的持續訓練服務,所以您不需要管理資源擴展、維護程式碼或維護訓練資料等事宜。使用 Amazon Comprehend,您可以:

  • 從任何形式的文件中發現有價值的洞察
  • 從文件中擷取情緒、文字、短語或主題,簡化文件處理管道
  • 識別和編輯私人文件中的個人身分識別資訊 (PII)

了解如何使用 Amazon Textract 和 Amazon Comprehend 建置一條龍式的 IDP 解決方案

立即註冊帳戶,開始體驗 AWS 的智慧文件處理功能。

AWS 上的後續步驟

註冊免費帳戶

立即存取 AWS 免費方案。

註冊 
開始在主控台進行建置

開始在 AWS 管理主控台進行建置。

登入