Publicado en: Jun 30, 2021

A medida que prepara sus datos, AWS Glue DataBrew agrega soporte para identificar y marcar de manera automática tipos de datos avanzados para columnas, lo cual facilita la normalización de columnas que contienen tipos de datos: número de la seguridad social (NSS), dirección de email, número de teléfono, género, tarjeta de crédito, URL, dirección IP, fecha y hora, divisa, código ZIP, país, región, estado y ciudad. De manera adicional, DataBrew marca visualmente columnas que contienen información de identificación personal (Personally Identifiable Information, PII), de modo que puede analizar con facilidad todas las columnas de PII en sus conjuntos de datos y aplicar transformaciones. Obtenga más información sobre todos los tipos de datos avanzados compatibles.

Para asignar columnas con un tipo de datos avanzados, solo tiene que hacer clic en la columna y DataBrew identificará automáticamente el tipo de datos, generará estadísticas de validez de datos y brindará recomendaciones para normalizar los datos en la columna. Una vez identificados, puede utilizar las más de 250 transformaciones integradas de DataBrew, como eliminar valores inválidos, sustituir valores que faltan y extraer valores personalizados para preparar con facilidad sus datos sin escribir ningún código.