Publicado en: Feb 10, 2021

La transformación de ML de FindMatches en AWS Glue incluye a partir de ahora información sobre hasta que punto cada columna del conjunto de datos contribuyó a determinar si los registros concuerdan. La transformación de FindMatches le permite identificar registros coincidentes o duplicados en su conjunto de datos, incluso si los registros no tienen un identificador común único y no hay campos que concuerden de manera exacta. Esta función hace que sea más fácil decidir cómo mejorar sus transformaciones de FindMatches.

Anteriormente, era necesario utilizar un proceso iterativo y seguir las directrices de prácticas recomendadas respecto a ingeniería de características para mejorar sus transformaciones de ML de FindMatches. Con las métricas de importancia de columnas, AWS Glue le brinda comentarios directos sobre hasta qué punto influyen los contenidos de cada columna a la hora de determinar qué conjuntos de registros concuerdan entre sí. Puede utilizar esta información para transformar su conjunto de datos y así mejorar la calidad de concordancia.

La transformación de ML de FindMatches está disponible en las mismas regiones de AWS que AWS Glue.

Para obtener más información sobre FindMatches, visite nuestra documentación.