게시된 날짜: Nov 16, 2021
AWS Glue의 FindMatches 기계 학습 변환을 통해, 새롭게 도착한 데이터와 기존의 일치된 데이터 집합 간의 일치 여부를 확인할 수 있게 되었습니다. FindMatches 변환을 사용하면 레코드에 공통 고유 식별자가 없고 정확히 일치하는 필드가 없는 경우에도 데이터 집합에서 중복되거나 일치하는 레코드를 식별할 수 있습니다. 이를 통해 데이터 집합 정리 및 중복 제거가 빠르고 쉬워집니다.
AWS Glue FindMatches는 고객 레코드 연결, 제품 카탈로그 중복 제거, 사기 탐지와 같은 사용 사례에서 부분적으로 일치하는 레코드의 식별 과정을 자동화합니다. FindMatches에서 증분적 매칭을 사용하면 데이터 집합 결합 및 일치/불일치 데이터 혼합 과정 없이 새로운 데이터와 기존 데이터의 일치 여부를 확인할 수 있습니다.
이 기능은 AWS Glue와 동일한 AWS 리전에서 이용 가능합니다.