Veröffentlicht am: Aug 16, 2023

AWS Glue Studio bietet jetzt fünf neue visuelle Transformationen: „Datensatzabgleich“, „Nullzeilen entfernen“, „Zeichenfolgenfragmente aus einem regulären Ausdruck extrahieren“, „JSON-Spalte analysieren“ und „JSON-Pfad extrahieren“. AWS Glue Studio bietet eine visuelle Schnittstelle zum Extrahieren, Transformieren und Laden (ETL), um Aufträge von AWS Glue ETL zu erstellen, auszuführen und zu überwachen. Mit diesen neuen Komponenten können ETL-Entwickler schnell anspruchsvollere Datenpipelines erstellen, ohne selbst Code schreiben zu müssen.

Jede dieser fünf neuen Transformationen richtet sich an einen bestimmten Datenverarbeitungsbedarf: Verwenden Sie „Nullzeilen entfernen“, um die Anzahl der Zeilen zu reduzieren und nur die Zeilen mit Daten beizubehalten, wählen Sie „Zeichenkettenfragmente aus einem regulären Ausdruck extrahieren“, um die relevanten Teile einer Zeichenkette zu extrahieren und die relevanten Informationen auszuwählen, verwenden Sie die ML-Modelle von Glue mit Datensatzabgleich, um andere potenzielle Duplikate in Ihrem Datensatz zu identifizieren, transformieren Sie JSON-Zeichenketten mit JSON-Spalte analysieren, mit der Sie eine JSON-Zeichenkette in eine Datenstruktur oder ein Array umwandeln können, oder extrahieren Sie nur den JSON-Pfad, den Sie benötigen, mit JSON-Pfad extrahieren. Die neuen Transformationen sind sowohl in visuellen als auch in codebasierten Jobs verfügbar.

Dieses neue Feature ist jetzt in allen kommerziellen AWS-Regionen verfügbar, in denen AWS Glue angeboten wird. In der AWS-Regionaldienstliste finden Sie die aktuellsten Verfügbarkeitsinformationen.

Weitere Informationen finden Sie in der AWS-Glue-Dokumentation.