Publié le: Nov 16, 2021
La transformation ML de FindMatches dans AWS Glue vous permet désormais de faire correspondre les données nouvellement arrivées avec des jeux de données correspondant existants. La transformation FindMatches vous permet d'identifier les doublons ou les enregistrements concordants dans votre jeu de données, même lorsque ces enregistrements n'ont pas d'identifiant unique en commun et qu'aucun champ ne correspond exactement. Elle permet de nettoyer et de dédupliquer plus rapidement et plus facilement les jeux de données.
AWS Glue FindMatches automatise le processus d'identification des enregistrements partiellement correspondants pour des cas d'utilisation tels que la liaison d'enregistrements de clients, la déduplication de catalogues de produits et la détection de fraude. Utilisez la comparaison progressive dans FindMatches pour faire correspondre de nouvelles données à des données existantes sans combiner les jeux de données et mélanger les données correspondantes et non correspondantes.
Cette fonction est disponible dans les mêmes régions AWS qu'AWS Glue.
Pour en savoir plus, consultez notre documentation et lisez l'article de blog.