Publicado en: Mar 30, 2022
La versión 2.0 de AWS Glue ahora admite la transformación de machine learning de AWS Glue FindMatches. AWS Glue FindMatches automatiza el proceso de identificación de registros que coinciden de forma parcial para casos de uso que incluyen la vinculación de registros de clientes, la deduplicación de catálogos de productos y la detección de fraudes. Al utilizar Glue 2.0, los trabajos de extracción, transformación y carga (ETL) que realizan correspondencias aproximadas mediante FindMatches se inician en menos de un minuto y su facturación mínima es de 1 minuto.
Utilice la transformación de FindMatches para identificar y posteriormente fusionar o deduplicar registros relacionados en los conjuntos de datos. Por ejemplo, puede reconocer que los registros coinciden a pesar de diferencias ortográficas y de formato, como en los casos de “John Doe” frente a “Jhn Doe”, “JOHN_DOE@ANYCOMPANY.COM” frente a “johndoe@anycompany.com” o “555-010-0000” frente a “+1-555-010-0000”.
Esta característica está disponible en las mismas regiones de AWS que AWS Glue.
Para obtener más información, consulte nuestra documentación y lea la publicación en el blog de FindMatches.