Veröffentlicht am: Jul 23, 2021
Mit AWS Glue DataBrew können Kunden jetzt angeben, welche Datenqualitätsstatistiken für Datensätze automatisch generiert werden sollen, wenn ein Profilauftrag ausgeführt wird. Dadurch können Benutzer die Datenprofilstatistiken, wie z. B. die Ermittlung von doppelten Werten, Korrelationen und Ausreißern, basierend auf der Art und Größe ihrer Datensätze anpassen und eine benutzerdefinierte Datenprofilübersicht mit nur den Statistiken erstellen, die ihren Anforderungen entsprechen.
DataBrew stellt alle Statistiken eines Profilauftrags in einem visuellen Profil-Dashboard dar und speichert die Rohdaten als JSON-Objekt in einem Amazon S3-Bucket. Kunden können steuern, welche Statistiken angezeigt werden sollen, die Qualität der eingehenden Daten im Laufe der Zeit überwachen und Änderungen an den Daten innerhalb von Minuten entdecken - und das alles, ohne Code schreiben zu müssen. Kunden können ebenfalls automatische Datenqualitätswarnungen einrichten, wleche DataBrew und AWS Lambda benutzen, so wie in diesem Blog Post beschrieben.
Besuchen Sie zum Einstieg die AWS-Managementkonsole oder installieren Sie das DataBrew-Plug-In in Ihrer Notebook-Umgebung und lesen Sie die DataBrew-Dokumentation.