Publicado en: Jan 28, 2021

Ahora, AWS Glue DataBrew admite las siguientes opciones de delimitadores para sus conjuntos de datos, lo que brinda flexibilidad para incorporar diferentes tipos de archivos .csv y .tsv en DataBrew para la preparación de los datos. Los delimitadores compatibles incluyen:

  • coma (,)
  • dos puntos (:)
  • punto y coma (;)
  • barra vertical (|)
  • tabulador (\t)
  • símbolo de intercalación (^)
  • espacio ( )

AWS Glue DataBrew brinda a los clientes más de 250 transformaciones integradas para automatizar tareas de preparación de datos (por ejemplo, filtrado de anomalías, estandarización de formatos y corrección de valores no válidos) que, de lo contrario, requerirían escribir de forma manual código de transformaciones durante días o semanas. Una vez que los datos han sido preparados, los clientes pueden comenzar a usarlos de inmediato con servicios de aprendizaje automático y análisis, de terceros y de AWS, para consultar dichos datos y entrenar modelos de aprendizaje automático.

Para obtener más información, visite este video de introducción o utilice un conjunto de datos de muestra para explorar DataBrew.