Veröffentlicht am: May 27, 2021
AWS Glue DataBrew unterstützt jetzt Nest- und Unnest-Transformationen, damit Benutzer Daten in Spalten packen oder entpacken und so ihre Datensätze manipulieren können. Durch diese Transformationen können Benutzer nun mühelos Daten aus genesteten JSON-Zeichenfolgenfeldern extrahieren oder Daten kombinieren, ohne Code schreiben zu müssen.
Benutzer, die Daten nesten wollen, können aus einer Liste von Quellspalten wählen und sie in ein Stuktur-, Karten- oder Array-Format kompaktieren. Benutzer, die ungenestete Daten erhalten wollen, müssen genestete Daten aus einer Array-, Karten-, Struktur- oder Zeichenfolgenspalte entpacken, um neue Zeilen oder Spalten zu erstellen. Benutzer können Unnest-Vorgänge auf mehreren Ebenen von JSON-Eingabedaten anwenden. Darüber hinaus können Benutzer auch Schlüssel/Wert für genestete Zeichenfolgenspalten extrahieren, um separate Spalten zu erstellen, und vorhandene JSON-Zeichenfolgenspalten zu Array- oder Strukturspalten ändern. Hier erfahren Sie mehr über Datenstrukturtransformationen.
AWS Glue DataBrew ist ein visuelles Datenvorbereitungstool, mit dem Sie Daten mithilfe von mehr als 250 vorgefertigten Transformationen für die Datenvorbereitung ganz einfach bereinigen und normalisieren können, ohne Code schreiben zu müssen.
Besuchen Sie zum Einstieg die AWS-Managementkonsole oder installieren Sie das DataBrew-Plugin in Ihrer Notebook-Umgebung und lesen Sie die DataBrew-Dokumentation.