什麼是 OCR 軟體?
光學字元辨識 (OCR) 是文字識別軟體,可將紙質文件、相片和影片轉換為可搜尋的數位文件檔案。使用 OCR 處理圖片或文件後,企業將其變更為可供機器讀取的 PDF,並且能夠加以搜尋、共用、編輯,並用於資料分析。
OCR 解決方案能夠透過掃描的文件、相片、影片、相機影像檔和純影像 PDF 產生可搜尋的資料。使用 OCR 程式無需手動輸入資料,並可將數位化資訊載入資料庫內,以便用於商業智慧、稽核、處理、合規性作業,甚至能夠納入更大型的機器人流程自動化 (RPA)。
您可使用多種開放原始碼和 SaaS OCR 工具,每個工具都可讓企業偵測圖像中的輸入文字或手寫語言,並將其轉換為可搜尋、可供機器讀取的文件。Amazon Textract 是可用選項中的業界領先標準,十分適合希望採用高度可擴展深度學習技術來滿足其需求的企業。Textract 的功能不限於 OCR,還可識別欄位的內容 (如鍵值對)、資訊的前後關聯和資料表中的資訊等項目。
Amazon Textract 每天分析數十億個影片和影像,可提供全面的智慧文件處理功能套件。其易於使用的介面,非常適合不具機器學習軟體專業知識的人員,而直觀的 API 操作,可讓您輕鬆分析圖像和 PDF 文件。Textract 會不斷地自我學習和改進,Amazon 也會持續為服務新增全新功能,以確保企業能透過這項服務獲得最大的效益。
OCR 軟體有哪些主要功能?
光學字元辨識軟體包含了幾種可簡化業務流程的功能。
從表單中擷取文字。
組織應該尋找可以擷取含前後關聯表單資料的 OCR 軟體。將表單轉換為文字段落會隱藏表單中的資料,降低其實用性。相對地,OCR 軟體應將表單轉換為可以輕鬆上傳到資料存放區進行分析的結構化資料格式。自動資料輸入功能可降低在資料輸入流程中出現人為錯誤的可能性,並加速資料數位化作業。
Amazon Textract 會使用 AI 模型自動偵測文件和所掃描表單中的鍵值對。這些鍵值對 (例如將 "Name" 作為索引鍵,且將人員的名稱作為值) 能夠協助為文件提供前後關聯,並支援資料收集、處理和排序作業。Textract 會擷取資料,並將其轉換為結構化的 JSON 格式,以便下游商業智慧平台輕鬆地擷取和處理資料。
從資料表儲存格中擷取資料
資料表是以結構化格式呈現資訊的標準方法,尤其適用於商業發票、稅務文件或其他正式文件中。部分 OCR 平台難以分析資料表內資料欄和資料列隱含的格式。領先的 OCR 工具可以從資料表和資料表儲存格擷取文字,同時保留其結構關係。對於任何依賴於表格式擷取文字資料的領域而言,支援此功能的 OCR 引擎至關重要。
Amazon Textract 可以從資料表和個別資料表儲存格中擷取資料,並以 TXT 檔案、CSV 或 JSON 格式 (取決於哪種格式最適合您的企業) 傳回結果。資料表會以區塊物件形式傳回,並能借助一種光學文字辨識功能,區分資料表標題與隸屬於特定資料欄或資料列類別的文字。
自動識別佈局
企業可能必須處理帶有各種格式、樣式和內容的文件。例如,一家公司可能需要處理數字發票、擷取長篇書面文件、查詢白皮書,以及查看包含簽章、名稱和地址的合約。了解這些不同的佈局以及資訊的結構排列,是 OCR 引擎的重要功能。
Amazon Textract 可以偵測和分類不同佈局的關鍵元素,識別資料表、標頭、註腳、段落、手寫註記、標題和簽章。透過使用邊界框,Amazon Textract 可以尋找每個元素的唯一中繼資料,同時可搜尋的文件會反映原始佈局。
自動偵測簽章
簽章是合約中的常用功能,用於驗證目的且包含在合規性檔案中。企業在無需人工閱讀整個合約的情況下,需要快速偵測文件是否具有所需簽章的功能。能夠掃描文件以識別簽章的光學字元辨識軟體,可消除人工審查合約的需求,進而加快驗證文件的流程。
Amazon Textract 會立即識別頁面上的手寫標記,利用其分析功能來識別草寫字跡或其他有助於證明簽章有效性的因素。然後,Textract 會向使用者提示簽章在所掃描法律文件中的位置,使其得以直接跳至文件的特定區域並驗證簽章是否存在。如果在重要文件上找不到簽章,企業可以搭配使用此流程與 RPA,以自動請求簽章。
以查詢為基礎的擷取
為了節省時間,企業可能希望直接查詢其數位化文件,立即獲得可解答問題的答案。例如,他們能夠搜尋特定日期、名稱或其他特定資訊來完成查詢,而不是讀取整個文件。雖然傳統的 OCR 引擎只能將文件數位化,但現代軟體解決方案可同時建立資料庫,以供使用者查詢。
例如,Amazon Textract 可以查詢文件中的特定資訊。使用者可以輸入「客戶的付款參考編號是什麼?」,然後觸發 Amazon Textract 以在文件中搜尋此項資訊,然後將其傳回給使用者。Textract 會在此流程中使用 AnalyzeDocument 和 GetDocumentAnalysis 功能,讓使用者得以在文件中搜尋想要的任何資訊。使用者可以根據公司文件調整模型輸出,進而建立自訂查詢。在特定使用案例和業務場景中使用額外註解或標籤調整模型,可以幫助實現豐富多樣的查詢方式。
以程式碼為基礎的擷取支援
以程式碼為基礎的擷取支援,使企業能夠將 OCR 工具整合至後端系統,以結合使用此類工具與其他工具 (例如 RPA 工作負載、GUI 工具和其他後端系統)。透過程式碼整合 OCR 有助於擴展 OCR 工具的功能,而透過 API 可以將此軟體連接至其他應用程式。Amazon Textract 提供一系列 API,企業可使用這些 API 進一步簡化業務流程,並實現更大規模的內部流程自動化。
OCR 如何從表單中擷取文字?
如果貴組織有計畫使用 OCR 的特定使用案例,請選用針對該使用案例自訂的光學字元辨識軟體。部分常用的使用案例包括:
發票和收據
發票和收據載有結構化程度極高的資料,包括帳單數字、稅捐資訊、貨幣詳細資料、帳戶號碼和名稱。Amazon Textract 等 OCR 引擎能夠簡化這些資訊的收集流程、自動化資料收集作業,並最佳化與財務相關的帳單和流程。透過搭配使用 OCR 技術與其他商業軟體,公司能夠自動掃描發票、發起退款作業,以及為使用者報銷公司的相關支出。
身分證明文件
使用 OCR 引擎處理身分證明文件,是另一種常見的企業使用案例。需要從護照、駕駛執照、身分證或其他身分證明文件中擷取資訊的組織,可以使用 OCR 引擎來簡化入職、合規性、存取控制和資料收集作業。將 Textract 等 OCR 平台整合至業務可以改善客戶體驗,同時也因為行政人員不再需要手動處理影像檔案,所以可以減輕這些人員的壓力。
貸款申請
申請貸款的流程包括收集銀行對帳單、身分證明文件、歷年報稅資料、信用報告、雇主出具的函件等眾多文件,具體取決於貸款的目的。透過使用 OCR 技術處理這些文件,企業可以節省時間並縮短更新貸款申請進度的作業週期。金融機構還可以依靠 Amazon Textract 等工具來消除手動資料輸入流程內的任何人為型錯誤,並確保每個人都經過公平的貸款評估。
AWS 如何支援您的 OCR 需求?
充分利用 OCR 的企業可以加快文件處理、快速從表單收集資料,並改善任何依賴書面、手寫或掃描文件的業務流程。Amazon Textract 可以偵測英語、德語、法語、西班牙語、義大利語和葡萄牙語的印刷文字和手寫筆跡。該功能還可以從幾乎任何發票或收據的商品或服務明細清單中擷取明確隱含的資料、標記的資料和明細項目,無需任何範本或組態。您還可以存取幾項進階功能,以用於針對特定使用案例進行自訂及更多選項。
立即建立免費帳戶,著手使用 AWS 的 OCR 軟體。