Amazon SageMaker bietet zusätzliche Visual-ETL-Transformationen und Unterstützung für S3 Tables
Amazon SageMaker bietet jetzt 14 neue integrierte Visual-ETL-Transformationen: „Format timestamp“, „Split string“, „Regex extractor“, „Autobalance processing“, „UUID (Universally Unique Identified)“, „Identifier“, „Unpivot columns into rows“, „Pivot rows into columns“, „Parse JSON column“, „Extract JSON path“, „Lookup“, „Conditional router“, „Route group“ und „Order by“. Mit diesen Transformationen können ETL-Entwickler schnell komplexe Datenpipelines erstellen, ohne speziellen Code für diese allgemeinen Transformationsaufgaben schreiben zu müssen. Außerdem werden Amazon S3 Tables jetzt über den Amazon-SageMaker-Lakehouse-Knoten unterstützt. Dies bietet Ihnen die Flexibilität, direkt in S3 Tables auf Daten zuzugreifen und eine Vorschau dieser Daten anzuzeigen.
Visual ETL in Amazon SageMaker bietet eine Drag-and-Drop-Schnittstelle zum Erstellen von ETL-Flows und zum Authoring von Flows mit Amazon Q Developer. Jede der neuen Visual-ETL-Transformationen deckt eine einzigartige Datenverarbeitungsanforderung ab. Verwenden Sie beispielsweise „Identifier“, um jeder Zeile im Datensatz einen numerischen Bezeichner zuzuweisen, transformieren Sie JSON-Strings mit „Parse JSON column“, womit Sie eine JSON-Zeichenfolge in eine Datenstruktur oder ein Array umwandeln können, oder extrahieren Sie mit der Transformation „Extract JSON path“ nur den JSON-Pfad, den Sie benötigen.
Diese Visual-ETL-Transformationen sind jetzt in allen AWS-Regionen verfügbar, in denen Amazon SageMaker verfügbar ist. Greifen Sie auf die Liste der unterstützten Regionen zu, um die aktuellsten Verfügbarkeitsinformationen zu erhalten.
Weitere Informationen finden Sie in unserer Amazon SageMaker-Dokumentation.