Publicado: Jan 28, 2021
O AWS Glue DataBrewagora oferece suporte às seguintes opções de delimitador para seus conjuntos de dados, oferecendo flexibilidade para trazer uma variedade de arquivos .csv e .tsv para o DataBrew para preparação de dados. Os delimitadores compatíveis incluem:
- vírgula (,)
- dois pontos (:)
- ponto e vírgula (;)
- barra vertical (|)
- guia (\t)
- circunflexo (^)
- espaço ( )
O AWS Glue DataBrew oferece aos clientes mais de 250 transformações pré-criadas para automatizar tarefas de preparação de dados (por exemplo, filtragem de anomalias, padronização de formatos e correção de valores inválidos) que, de outra forma, exigiriam dias ou semanas de gravação de transformações codificadas manualmente. Depois que os dados estão preparados, os clientes podem começar a usá-los imediatamente com o AWS e análises de terceiros e serviços de machine learning para consultar os dados e treinar modelos de marchine learniing.
Para saber mais, assista a este vídeo de introdução ou use um conjunto de dados de amostra para explorar o DataBrew.
Para começar, acesse o Console de Gerenciamento da AWS ou instale o plugin do DataBrew em seu ambiente de notebooke consulte a documentação do DataBrew.