張貼日期: Aug 9, 2019

您現在可以使用 AWS Glue 並透過新的 FindMatches ML 轉換來尋找資料集中的相符記錄 (包括沒有識別符的記錄),這是一種自訂的機器學習轉換,能幫助您識別相符的記錄。將 FindMatches 轉換新增至您的 Glue ETL 任務,您便能找到相關的產品、地點、供應商和客戶等。

您也可以利用 FindMatches 轉換刪除重複的資料,例如找出已多次註冊的客戶、在產品型錄意外多次新增的產品等等。您可以透過範例,讓 FindMatches ML 轉換了解「重複」的定義,並使用機器學習找出資料集中其他潛在的重複記錄。

AWS Glue ML 轉換一開始會先在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、歐洲 (愛爾蘭) 及亞太區域 (東京) 等 AWS 區域推出。

若要進一步了解此功能,請參閱我們的文件