Publicado: Aug 9, 2019
Agora, você pode usar o AWS Glue para encontrar registros correspondentes em um conjunto de dados (incluindo os sem identificadores) usando a nova transformação de ML FindMatches, uma transformação de machine learning personalizada que ajuda a identificar registros correspondentes. A adição da transformação FindMatches a tarefas de ETL do Glue permite encontrar produtos, locais, fornecedores e clientes relacionados, entre outros dados.
Você também pode usar a transformação FindMatches para eliminar duplicidades em atividades como identificar clientes que se cadastraram mais de uma vez, produtos que foram adicionados acidentalmente mais de uma vez a um catálogo de produtos e assim por diante. É possível ensinar à transformação de ML FindMatches a sua definição de “duplicidade” por meio de exemplos. A transformação usará machine learning para identificar outras possíveis duplicidades no conjunto de dados.
As transformações de ML do AWS Glue estão disponíveis nas regiões da AWS Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), UE (Irlanda) e Ásia-Pacífico (Tóquio).
Para saber mais sobre esse recurso, acesse a nossa documentação.