Publicado: Mar 30, 2022
Agora, a versão 2.0 do AWS Glue oferece suporte à transformação de machine learning do AWS Glue FindMatches. O FindMatches do AWS Glue automatiza o processo de identificação de registros parcialmente correspondentes para casos de uso, incluindo a vinculação de registros do cliente, a deduplicação de catálogos de produtos e a detecção de fraude. Usando o Glue 2.0, os trabalhos de ETL que realizam correspondência difusa usando FindMatches começam em menos de um minuto e têm faturamento mínimo de 1 minuto.
Use a transformação FindMatches para identificar e mesclar ou desduplicar registros relacionados em seus conjuntos de dados. Por exemplo, ele pode reconhecer que os registros são correspondências, apesar das diferenças de ortografia e formatação, como “John Doe” x “Jhn Doe”, “JOHN_DOE@ANYCOMPANY.COM” x “johndoe@anycompany.com”, ou “555-010-0000” x “+1-555-010-0000”.
Este recurso está disponível nas mesmas regiões da AWS do AWS Glue.
Para saber mais, consulte nossa documentação e leia a postagem do blog do FindMatches.