Publicado en: May 27, 2021
AWS Glue DataBrew ahora es compatible con transformaciones anidadas y sin anidar para ayudar a los usuarios a empaquetar o desempaquetar datos en columnas para manipular sus conjuntos de datos. Gracias a estas transformaciones, los usuarios ahora pueden extraer fácilmente datos de campos de cadenas JSON anidadas o combinar datos sin escribir ningún código.
Para anidar datos, los usuarios pueden elegir entre una lista de columnas de origen y compactarlos en un formato de estructura, mapa o raíz. Para desanidar datos, los usuarios pueden desempaquetas datos anidados de una matriz, mapa, estructura o columna de cadenas para crear nuevas filas o columnas. Los usuarios pueden aplicar operaciones para desanidar en varios niveles de datos JSON de entrada. Además, los usuarios pueden extraer el par clave valor de columnas de cadenas anidadas para crear columnas separadas, y cambiar las columnas de cadenas JSON existentes para disponer o estructurar columnas. Puede obtener más información sobre las transformaciones de estructuras de datos aquí.
AWS Glue DataBrew es una herramienta de preparación de datos visuales que facilita la limpieza y normalización de datos mediante más de 250 transformaciones integradas para preparación de datos, sin necesidad de escribir ningún código.
Para comenzar, visite la consola de administración de AWS o instale el complemento de DataBrew en el entorno de bloc de notas y consulte la documentación de DataBrew sobre todas las transformaciones disponibles.