Veröffentlicht am: Aug 9, 2019
Sie können jetzt AWS Glue verwenden, um übereinstimmende Aufzeichnungen in Ihren Datensätzen aufzufinden (einschließlich der Datensätze ohne Kennungen), indem Sie den neuen benutzerdefinierten Machine-Learning-Transformationsservice FindMatches ML Transform verwenden. Dieser hilft Ihnen bei der Identifizierung von übereinstimmenden Aufnahmen. Durch das Hinzufügen des FindMatches ML Transform-Service zu Ihren Glue ETL-Jobs können Sie verwandte Produkte, Orte, Lieferanten, Kunden und mehr finden.
Sie können unter anderem auch den Transformationsservice FindMatches für das Deduplizieren sowie für das Identifizieren von Kunden verwenden, die sich mehr als einmal angemeldet haben, sowie von Produkten, die mehr als einmal versehentlich zu Ihrem Produktkatalog hinzugefügt worden sind. Sie können dem Transformationsservice FindMatches ML Ihre Definition eines „Duplikats“ durch beispiele beibringen. Der Service verwendet dann die Machine-Learning-Technologie zur Identifizierung anderer potenzieller Duplikate in Ihrem Datensatz.
AWS Glue ML Transform ist anfänglich in den AWS-Regionen USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon), EU (Irland) und Asien-Pazifik (Tokio) verfügbar.
Weitere Informationen zu dieser Funktion finden Sie in der Dokumentation.