Publicado en: Feb 24, 2022
Los clientes de AWS Glue DataBrew ahora pueden elegir que se genere un único archivo de salida o varios de ellos en lugar de archivos generados automáticamente para sus trabajos de recetas en DataBrew. Los clientes pueden generar un único archivo de salida cuando el volumen de los elementos de salida es pequeño o si los sistemas posteriores deben consumirlos con mayor facilidad, por ejemplo, las herramientas de visualización. En algunos casos, los clientes desean personalizar las particiones del archivo de salida para lograr un almacenamiento y una transferencia eficientes.
Cuando configuren trabajos de recetas en DataBrew, los clientes pueden simplemente seleccionar la opción de archivo de salida único o especificar un número de archivos de salida. Esto les brinda la flexibilidad necesaria para administrar las salidas de los trabajos de recetas para su visualización, el análisis de datos y la generación de informes, a la vez que evitan que se generen demasiados archivos.
Esta característica está disponible en la mayoría de las regiones públicas de AWS y en AWS GovCloud (Oeste de EE. UU.). Descubra dónde está disponible AWS Glue DataBrew consultando la tabla de regiones de AWS. AWS Glue DataBrew es una herramienta visual de preparación de datos que facilita la limpieza y la normalización de los datos mediante más de 350 transformaciones predefinidas, todo ello sin necesidad de escribir ningún código. Puede automatizar el filtrado de anomalías, la conversión de datos a formatos estándar, la corrección de valores no válidos y otras tareas.
Para comenzar, consulte los siguientes recursos: