Veröffentlicht am: Jun 30, 2021

Während Sie Ihre Daten vorbereiten, fügt AWS Glue DataBrew die Unterstützung hinzu, um erweiterte Datentypen für Spalten automatisch zu identifizieren und zu markieren, was die Normalisierung von Spalten mit den folgenden Datentypen erleichtert: Sozialversicherungsnummer (SSN), E-Mail-Adresse, Telefonnummer, Geschlecht, Kreditkarte, URL, IP-Adresse, Datum und Uhrzeit, Währung, Postleitzahl, Land, Region, Bundesland/Staat und Stadt. Darüber hinaus markiert DataBrew Spalten mit personenbezogenen Daten (PII) visuell, sodass Sie problemlos nach allen PII-Spalten in Ihrem Datensatz suchen und Transformationen anwenden können. Weitere Informationen über alle unterstützten erweiterten Datentypen.

Um Spalten mit einem erweiterten Datentyp zuzuweisen, können Sie einfach auf die Spalte klicken und DataBrew identifiziert den Datentyp automatisch, generiert Statistiken zur Datengültigkeit und gibt Empfehlungen zur Normalisierung der Daten in der Spalte. Nach der Identifizierung können Sie die über 250 integrierten Transformationen von DataBrew verwenden, z. B. ungültige Werte entfernen, fehlende Werte ersetzen und benutzerdefinierte Werte extrahieren, um Ihre Daten einfach vorzubereiten, ohne Code schreiben zu müssen. 

Besuchen Sie die AWS-Managementkonsole oder installieren Sie das DataBrew-Plug-In in Ihrer Notebook-Umgebung