Veröffentlicht am: Jan 28, 2021
AWS Glue DataBrew unterstützt jetzt die folgenden Trennzeichenoptionen für seine Datensätze, sodass Sie die Flexibilität haben, eine Vielzahl von CSV- und TSV-Dateien zur Datenaufbereitung in DataBrew zu verwenden. Zu den unterstützten Trennzeichen gehören:
- Komma (,)
- Doppelpunkt (:)
- Strichpunkt (;)
- senkrechter Strich (|)
- Tabulatorzeichen (\t)
- Caret (^)
- Leerzeichen ( )
AWS Glue DataBrew bietet Kunden über 250 vorgefertigte Transformationen, um Datenaufbereitungsaufgaben (z. B. Filtern von Anomalien, Formatstandardisierung und Korrektur ungültiger Werte) zu automatisieren, bei denen ansonsten Tage oder Wochen für das Schreiben handkodierter Transformationen vergehen würden. Sobald die Daten aufbereitet sind, können Kunden sofort mit AWS und Analysen von Drittanbietern und Machine-Learning-Services verwenden, um die Daten abzufragen und Machine-Learning-Modelle zu trainieren.
Um mehr zu erfahren, sehen Sie sich dieses Video zu den ersten Schritten an oder verwenden Sie einen Beispieldatensatz, um DataBrew zu erkunden.
Besuchen Sie zum Einstieg die AWS-Managementkonsole oder installieren Sie das DataBrew-Plugin in Ihrer Notebook-Umgebung und lesen Sie die DataBrew-Dokumentation.