Publicado: Jun 30, 2021

À medida que você prepara seus dados, o AWS Glue DataBrew adiciona suporte para identificar e marcar automaticamente tipos de dados avançados para colunas, facilitando a normalização de colunas contendo dados dos seguintes tipos: Número de seguro social (SSN), Endereço de e-mail, Número de telefone, Sexo, Cartão de crédito, URL, Endereço IP, Data e hora, Moeda, CEP, País, Região, Estado e Cidade. Além disso, o DataBrew marca visualmente colunas contendo informações de identificação pessoal (PII), permitindo que você verifique facilmente todas as colunas de PII no seu conjunto de dados e aplique transformações. Saiba mais sobre todos os tipos de dados avançados com suporte.

Para atribuir um tipo de dados avançado a colunas, basta clicar na coluna, e o DataBrew identificará automaticamente o tipo de dados, gerará estatísticas de validade de dados e fornecerá recomendações para normalizar os dados nessa coluna. Após a identificação, você poderá usar mais de 250 transformações integradas do DataBrew, como remover valores inválidos, substituir valores ausentes e extrair valores personalizados para preparar facilmente seus dados sem escrever nenhum código.