Veröffentlicht am: Sep 20, 2023

AWS Glue Data Quality kann jetzt Datensätze identifizieren, die den Regeltyp CustomSQL haben, sodass Kunden problematische Datensätze von den guten Datensätzen isolieren können, damit nur qualitativ hochwertige Datenflüsse in ihre Data Lakes und Warehouses ermöglicht werden.

AWS Glue Data Quality berechnet automatisch Statistiken, empfiehlt Qualitätsregeln, überwacht die Datenqualität und benachrichtigt Benutzer, wenn ein Qualitätsverlust festgestellt wird. Kunden können Regeln mit über 25 vordefinierten Datenqualitätsregeltypen erstellen, die problematische Daten erkennen und beheben. Einer dieser Regeltypen ist der CustomSQL-Regeltyp, der es Kunden ermöglicht, SQL für die Erstellung komplexer Geschäftsregeln zu verwenden, mit denen Qualitätsprobleme identifiziert werden. Bislang identifizierte der CustomSQL-Regeltyp das Vorhandensein problematischer Datensätze, ohne sie gezielt zu identifizieren. Mit dieser neuen Version kann der CustomSQL-Regeltyp die spezifischen Datensätze ermitteln, die für Regelfehler verantwortlich sind, und sie zwecks Isolierung kennzeichnen. Mit diesem Feature können Kunden robuste Geschäftsregeln in SQL erstellen, problematische Datensätze erkennen und isolieren und die Lieferung qualitativ hochwertiger Daten an ihr Datenrepository gewährleisten.

Weitere Informationen finden Sie in unserer Dokumentation und im Blog.

Dieses Feature ist in allen kommerziellen AWS-Regionen verfügbar, in denen AWS Glue angeboten wird.