Veröffentlicht am: Nov 16, 2021

Mit der FindMatches-ML-Transformation in AWS Glue können Sie jetzt neu eingegangene Daten mit bereits vorhandenen Datensätzen abgleichen. Mit der FindMatches-Transformation können Sie doppelte oder übereinstimmende Datensätze in Ihrem Datensatz identifizieren, auch wenn die Datensätze keinen gemeinsamen eindeutigen Identifikator haben und keine Felder genau übereinstimmen. So können Datensätze schneller und leichter bereinigt und dedupliziert werden.

AWS Glue FindMatches automatisiert den Prozess der Identifizierung von teilweise übereinstimmenden Datensätzen für Anwendungsfälle, einschließlich Verknüpfung von Kundendatensätzen, Deduplizierung von Produktkatalogen und Betrugserkennung. Verwenden Sie den inkrementellen Abgleich in FindMatches, um neue Daten mit vorhandenen Daten abzugleichen, ohne die Datensätze zu kombinieren und abgeglichene und nicht abgeglichene Daten zu mischen.

Diese Funktion ist in den gleichen AWS-Regionen erhältlich wie AWS Glue.

Weitere Informationen finden Sie in unserer Dokumentation und im Blog-Post.