Publicado en: Nov 16, 2021
La transformación de ML de FindMatches en AWS Glue ahora le permite hacer coincidir los datos recién llegados con los conjuntos de datos coincidentes existentes. La transformación de FindMatches le permite identificar registros coincidentes o duplicados en su conjunto de datos, incluso si los registros no tienen un identificador común único y no hay campos que concuerden de manera exacta. Hace más rápida y fácil la limpieza y deduplicación de conjuntos de datos.
FindMatches de AWS Glue automatiza el proceso de identificación de registros parcialmente coincidentes para casos de uso que incluyen la vinculación de registros de clientes, la deduplicación de catálogos de productos y la detección de fraude. Utilice la coincidencia progresiva en FindMatches para hacer coincidir los nuevos datos con los existentes sin combinar los conjuntos de datos ni mezclar los datos coincidentes con los no coincidentes.
Esta característica está disponible en las mismas regiones de AWS que AWS Glue.
Para obtener más información, consulte nuestra documentación y lea la publicación en el blog.