Publicado en: Nov 18, 2021

Los usuarios de AWS Glue DataBrew ahora pueden crear reglas de calidad de datos, que son verificaciones de validación personalizables que definen requisitos empresariales para datos específicos. Puede crear reglas para verificar valores duplicados en ciertas columnas, validar que una columna no coincide con otra o definir más verificaciones personalizadas y condiciones según sus casos de uso de calidad de datos específicos. Puede agrupar reglas para un conjunto de datos específicos en un conjunto de reglas para una mayor eficiencia y aplicar estas verificaciones como parte de un trabajo de perfil de datos estándar. Los resultados se muestran en un panel de calidad de datos y en un informe de validación, de modo que le ayuda a ver con rapidez los resultados de las reglas y determinar si los datos son apropiados para utilizarlos.

AWS Glue DataBrew es una herramienta visual de preparación de datos que facilita la limpieza y la normalización de los datos mediante más de 250 transformaciones predefinidas, todo ello sin necesidad de escribir ningún código. Puede automatizar el filtrado de anomalías, la conversión de datos a formatos estándar, la corrección de valores no válidos y otras tareas.

Para comenzar con DataBrew, visite la consola de administración de AWS o instale el complemento de DataBrew en el entorno de bloc de notas. Para obtener más información, vea este video de introducción y consulte la documentación de DataBrew.