張貼日期: Dec 18, 2019

Amazon Textract 為機器學習服務,可讓您使用 DetectTextAnalyzeDoc API 快速且輕鬆地擷取文字和結構化資料,而無需任何自訂組態或範本。Amazon Textract 之類的受管服務的優勢之一是客戶可受益於未來的持續性改善。今天,我們非常高興地宣佈 Amazon Textract 現已通過 PCI DSS 認證。這意味著您現在可以針對所有需要支付卡產業資料安全標準 (PCI DSS) 資訊安全標準的工作負載使用 Amazon Textract,例如持卡人資料 (CHD) 或敏感驗證資料 (SAD)。而且自今日起,AWS 推出一組品質增強功能,讓 Amazon Textract 能為我們的表格和表單功能提供甚至更準確的結果。 

首先,我們的表格模型現在可更好配合複雜的表格結構,其中包含分割和合併的儲存格,讓使用者難以將儲存格值與正確的欄標頭或列標頭對齊。其次,Amazon Textract 在識別列和欄的儲存格是否有換行文字 (文字跨多行顯示) 方面有進一步的改進,甚至是沒有明顯邊界的表格。Amazon Textract 現在對具有跨多行內容的儲存格有更準確的判定,與沒有明顯邊界的新列相反。最後,Amazon Textract 還改進了表單模型,可針對鍵值組識別提供更準確的結果。這些優勢適用於多種類型的文件,但是對於表格和鍵值組出現在同一頁的文件來說,尤其明顯。現在,Amazon Textract 可正確識別表格中內嵌的鍵值組。 

您可以在這裡進一步了解有關更新的詳細資訊。