게시된 날짜: Feb 10, 2021
AWS Glue의 FindMatches ML 변환에 이제 데이터 집합의 각 열이 레코드 일치 여부를 확인하는 데 얼마나 기여했는지에 대한 정보가 포함됩니다. FindMatches 변환을 사용하면 레코드에 공통 고유 식별자가 없고 정확히 일치하는 필드가 없는 경우에도 데이터 집합에서 중복되거나 일치하는 레코드를 식별할 수 있습니다. 이 기능으로 FindMatches 변환의 개선 방법을 쉽게 결정할 수 있습니다.
이전에는 반복 프로세스를 사용하고 특성 추출에 대한 모범 사례 지침에 따라 FindMatches ML 변환을 개선해야 했습니다. 열 중요도 지표를 통해 AWS Glue는 레코드 집합이 서로 일치하는지 확인할 때 각 열의 내용에 얼마나 많은 가중치를 두는지에 대한 직접적인 피드백을 제공합니다. 이 정보로 데이터 집합을 변환하여 일치 품질을 개선할 수 있습니다.
AWS Glue와 동일한 AWS 리전에서 FindMatches ML 변환을 이용할 수 있습니다.
FindMatches에 대한 자세한 내용은 설명서를 참조하세요.