Veröffentlicht am: Feb 24, 2022
Kunden von AWS Glue DataBrew können jetzt einzelne oder mehrere Ausgabedateien anstelle von automatisch generierten Dateien für ihre Rezeptaufträge in DataBrew auswählen. Kunden können eine einzige Ausgabedatei erzeugen, wenn die Ausgabe klein ist oder nachgelagerte Systeme sie leichter verarbeiten müssen, wie z. B. Visualisierungstools. In bestimmten Situationen möchten Kunden die Partitionen der Ausgabedatei für eine effiziente Speicherung und Übertragung anpassen.
Kunden können bei der Konfiguration eines Rezeptauftrags in DataBrew einfach die Option für eine einzelne Ausgabedatei auswählen oder eine Anzahl für die Ausgabedateien angeben. Dadurch erhalten Kunden die Flexibilität, die Ausgaben von Rezeptaufträgen für die Visualisierung, Datenanalyse und Berichterstellung zu verwalten und gleichzeitig zu verhindern, dass zu viele Dateien erzeugt werden.
Diese Funktion ist in den meisten öffentlichen AWS-Regionen und in AWS GovCloud (USA-West) verfügbar. Sehen Sie, wo AWS Glue DataBrew verfügbar ist, indem Sie die Tabelle der AWS-Regionen verwenden. AWS Glue DataBrew ist ein visuelles Datenaufbereitungstool, mit dem sich Daten mithilfe von über 350 vorgefertigten Transformationen ganz einfach bereinigen und normalisieren lassen, ohne dass Sie Code schreiben müssen. Sie können die Filterung von Anomalien, die Konvertierung von Daten in Standardformate, die Korrektur ungültiger Werte und andere Aufgaben automatisieren.
Zum Einstieg empfehlen wir die folgenden Ressourcen: