Publicado en: Jan 28, 2021
Ahora, AWS Glue DataBrew admite las siguientes opciones de delimitadores para sus conjuntos de datos, lo que brinda flexibilidad para incorporar diferentes tipos de archivos .csv y .tsv en DataBrew para la preparación de los datos. Los delimitadores compatibles incluyen:
- coma (,)
- dos puntos (:)
- punto y coma (;)
- barra vertical (|)
- tabulador (\t)
- símbolo de intercalación (^)
- espacio ( )
AWS Glue DataBrew brinda a los clientes más de 250 transformaciones integradas para automatizar tareas de preparación de datos (por ejemplo, filtrado de anomalías, estandarización de formatos y corrección de valores no válidos) que, de lo contrario, requerirían escribir de forma manual código de transformaciones durante días o semanas. Una vez que los datos han sido preparados, los clientes pueden comenzar a usarlos de inmediato con servicios de aprendizaje automático y análisis, de terceros y de AWS, para consultar dichos datos y entrenar modelos de aprendizaje automático.
Para obtener más información, visite este video de introducción o utilice un conjunto de datos de muestra para explorar DataBrew.
Para comenzar, visite la consola de administración de AWS o instale el completo de DataBrew en su entorno de bloc de notas y consulte la documentación de DataBrew.