Publicado: Nov 18, 2021
Os clientes do AWS Glue DataBrew agora podem criar conjuntos de dados escrevendo instruções de Linguagem de consulta estruturada (SQL) para recuperar dados do Amazon Redshift e do Snowflake usando conexões Java Database Connectivity (JDBC). Você pode usar uma consulta específica para selecionar os dados desejados e limitar os dados retornados de tabelas grandes antes de limpar, normalizar e transformar esses dados com o DataBrew. Para obter uma lista de formatos de entrada com suporte, consulte a Lista de formatos de entrada do AWS Glue DataBrew.
O AWS Glue DataBrew é uma ferramenta visual de preparação de dados que facilita a limpeza e a normalização de dados usando mais de 250 transformações predefinidas, sem a necessidade de criar código. Você pode automatizar a filtragem de anomalias, converter dados para formatos padrão, corrigir valores inválidos e outras tarefas.
Para começar com o DataBrew, acesse o Console de Gerenciamento da AWS ou instale o plugin do DataBrew em seu ambiente de Notebook. Para saber mais, assista a este vídeo de introdução e consulte a documentação do DataBrew.