Publicado: Nov 17, 2021

A transformação de ML do FindMatches no AWS Glue agora inclui uma opção para gerar pontuações de correspondência, o que indica o quão similar cada agrupamento de registros é um do outro. A transformação do FindMatches permite a identificação de registros duplicados ou correspondentes no seu conjunto de dados, mesmo quando os registros não possuem um identificador único comum e nenhum campo com correspondência exata. O FindMatches ajuda a automatizar tarefas de deduplicação e limpeza de dados complexa.

O FindMatches do AWS Glue automatiza o processo de identificação de registros parcialmente correspondentes para casos de uso, incluindo a vinculação de registros do cliente, a deduplicação de catálogos de produtos e a detecção de fraude. Use a pontuação de correspondência no FindMatches para entender seus modelos do FindMatches, decidir se eles estão treinados de forma satisfatória e determinar quais registros mesclar.

Esse recurso está disponível nas mesmas regiões da AWS do AWS Glue.

Para saber mais, consulte nossa documentação e leia a postagem do blog do FindMatches.