Publicado: Nov 16, 2021
A transformação FindMatches ML no AWS Glue agora permite que você faça a correspondência dos dados recém-chegados com os conjuntos de dados correspondentes já existentes. A transformação FindMatches permite a identificação de registros duplicados ou correspondentes no seu conjunto de dados, mesmo quando os registros não possuem um identificador único comum e nenhum campo com correspondência exata. Isso torna a limpeza e a deduplicação dos conjuntos de dados mais rápidas e mais fáceis.
O AWS Glue FindMatches automatiza o processo de identificação de registros parcialmente correspondentes para os casos de uso, incluindo a vinculação de registros do cliente, a deduplicação de catálogos de produtos e a detecção de fraude. Use a correspondência incremental no FindMatches para fazer a correspondência dos dados novos com os antigos sem precisar combinar os conjuntos de dados, misturando dados correspondidos e não correspondidos.
Esse recurso está disponível nas mesmas Regiões da AWS que o AWS Glue.
Para saber mais, consulte nossa documentação e leia a postagem do blog.