Veröffentlicht am: Nov 18, 2021
AWS-Glue-DataBrew-Benutzer können jetzt Datenqualitätsregeln erstellen, d. h. anpassbare Validierungsprüfungen, die Geschäftsanforderungen für bestimmte Daten definieren. Sie können Regeln erstellen, um nach doppelten Werten in bestimmten Spalten zu suchen, um zu überprüfen, ob eine Spalte nicht mit einer anderen übereinstimmt, oder um viele weitere benutzerdefinierte Prüfungen und Bedingungen zu definieren, die auf Ihren spezifischen Anwendungsfällen für Datenqualität basieren. Sie können die Regeln für einen bestimmten Datensatz in einem Regelsatz zusammenfassen und diese Prüfungen als Teil eines Standarddatenprofils anwenden. Die Ergebnisse werden in einem Datenqualitäts-Dashboard und einem Validierungsbericht dargestellt, sodass Sie die Ergebnisse der Regeln schnell sehen und feststellen können, ob Ihre Daten für die Verwendung geeignet sind.
AWS Glue DataBrew ist ein visuelles Datenaufbereitungstool, mit dem sich Daten mithilfe von über 250 vorgefertigten Transformationen ganz einfach bereinigen und normalisieren lassen, ohne dass Sie Code schreiben müssen. Sie können die Filterung von Anomalien, die Konvertierung von Daten in Standardformate, die Korrektur ungültiger Werte und andere Aufgaben automatisieren.
Für erste Schritte mit DataBrew besuchen Sie die AWS-Managementkonsole oder installieren Sie das DataBrew-Plug-In in Ihrer Notebook-Umgebung. Weitere Informationen finden Sie in diesem Video zu den ersten Schritten und in der DataBrew-Dokumentation.