Publicado en: Mar 31, 2023

AWS Glue Studio ahora ofrece 10 nuevas transformaciones visuales: Concatenar (Concatenate), Dividir cadena (Split string), Matrices en columnas (Array to column), Agregar marca de tiempo actual (Add current timestamp), Dinamizar filas a columnas (Pivot rows to columns), Anular Dinamización de columnas a filas (Unpivot columns to rows), Buscar (Lookup), Expandir (Explode), Columna derivada (Derived column) y procesamiento de equilibrio automático (Autobalance processing). AWS Glue Studio ofrece una interfaz visual de extracción, transformación y carga (ETL) que ayuda a los desarrolladores de ETL a crear, ejecutar y supervisar rápidamente los trabajos de ETL de AWS Glue. Con estos nuevos componentes, los desarrolladores de ETL pueden crear rápidamente canalizaciones de datos más sofisticadas sin tener que escribir código.

Estas 10 nuevas transformaciones abordan una variedad de necesidades de procesamiento de datos: combine columnas con la transformación Concatenar o separe una cadena con un delimitador con la ayuda de Dividir cadena. Agregar marca de tiempo actual le permite registrar cuándo se procesaron sus datos. Dinamice filas en columnas y anule la dinamización de columnas en filas para ayudar a reestructurar los datos y combinarlos. La búsqueda es una forma sencilla de agregar columnas de otra tabla al conjunto de datos. La columna derivada le permite definir una columna nueva basada en otras columnas mediante expresiones matemáticas o SQL. Expandir descomprime las estructuras de datos anidadas y, por último, el procesamiento del equilibrio automático es una característica avanzada que mejora el rendimiento del trabajo cuando los datos no están bien distribuidos entre los trabajadores. Todas estas nuevas transformaciones están disponibles tanto en trabajos visuales como en los basados en código.

Estos nuevos componentes están disponibles en las mismas regiones de AWS que AWS Glue.

Para obtener más información, consulte la documentación de AWS Glue.