Publicado en: Aug 16, 2023

AWS Glue Studio ahora ofrece 5 nuevas transformaciones visuales: Record matching (Coincidencia de registros), Remove null rows (Eliminar filas nulas), Extract string fragments from a regular expression (Extraer fragmentos de cadenas de una expresión regular), Parse JSON column (Analizar columnas de JSON) y Extract JSON path (Extraer ruta de JSON). AWS Glue Studio ofrece una interfaz visual de extracción, transformación y carga (ETL) que ayuda a crear, ejecutar y supervisar rápidamente los trabajos de ETL en AWS Glue. Con estos nuevos componentes, los desarrolladores de ETL pueden crear rápidamente canalizaciones de datos más sofisticadas sin tener que escribir código.

Cada una de estas 5 nuevas transformaciones aborda una necesidad única de procesamiento de datos: utilice Remove null rows (Eliminar filas nulas) para reducir la cantidad de filas y conservar solo las que contienen datos, seleccione Extract string fragments from a regular expression (Extraer fragmentos de cadenas de una expresión regular) para extraer las partes relevantes de una cadena y seleccionar la información relevante, utilice los modelos de ML de Glue con Record matching (Coincidencia de registros) para identificar otros posibles datos duplicados en su conjunto de datos, transforme las cadenas JSON con Parse JSON column (Analizar columnas de JSON), que le permite convertir una cadena JSON en una estructura o matriz de datos, o extraiga solo la ruta de JSON que necesite con Extract JSON path (Extraer ruta de JSON). Las nuevas transformaciones están disponibles tanto en trabajos visuales como en los basados en código.

Esta nueva característica ya está disponible en todas las regiones comerciales de AWS en las que AWS Glue está disponible. Acceda al listado de servicios regionales de AWS para obtener la información más actualizada sobre disponibilidad.

Para obtener más información, consulte la documentación de AWS Glue.