Publicado en: Aug 9, 2019
Ahora puede usar AWS Glue para buscar registros coincidentes en un juego de datos (incluso los que no tienen identificadores) con la nueva transformación de ML de FindMatches, una transformación de aprendizaje automático personalizada que lo ayuda a identificar registros coincidentes. Al agregar la transformación de FindMatches a sus trabajos de Glue ETL, puede buscar productos, lugares, proveedores y clientes relacionados, y más.
También puede usar la transformación de FindMatches para realizar deduplicaciones, como identificar aquellos clientes que iniciaron sesión más de una vez, productos que se agregaron por error al catálogo de productos más de una vez, etc. Puede enseñar a la transformación de ML de FindMatches su definición de “duplicación” mediante ejemplos, y esta usará el aprendizaje automático para identificar otras posibles duplicaciones en su juego de datos.
La transformación de ML de AWS Glue estará disponible inicialmente en las regiones de AWS EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU Oeste (Oregón), UE (Irlanda) y Asia Pacífico (Tokio).
Para obtener más información acerca de esta característica, consulte nuestra documentación.