Publicado: Mar 9, 2021
Ao gerar perfis de qualidade de dados em seus conjuntos de dados, o DataBrew agora publica um painel visual no console do AWS Glue DataBrew com mais de 40 estatísticas e visualizações listadas em um formato tabular para fácil comparação. Compreender a qualidade dos dados é a chave para o sucesso de seus projetos de análise e machine learning. Com este novo recurso no DataBrew, é fácil detectar anomalias nas distribuições de dados, detectar outliers, entender distorções e muito mais para conjuntos de dados que variam de alguns milhares de linhas a dezenas de milhões de linhas e formatos de arquivo variados.
O AWS Glue DataBrew é uma ferramenta visual de preparação de dados que facilita a limpeza e a normalização de dados usando mais de 250 transformações pré-criadas para preparação de dados, sem a necessidade de criação de código.
Para começar, acesse o Console de Gerenciamento da AWS ou instale o plug-in do DataBrew em seu ambiente de notebooke consulte a documentação do DataBrew.