Publicado: Oct 2, 2023

A AWS anuncia a disponibilidade geral do AWS Glue Data Quality nas regiões AWS GovCloud (Leste dos EUA e Oeste dos EUA). O Glue Data Quality mede e monitora automaticamente a qualidade dos dados em repositórios de dados e pipelines de ETL do AWS Glue. O AWS Glue é um serviço de integração e extração, transformação e carregamento (ETL) de dados escalável e com tecnologia sem servidor que facilita a descoberta, preparação, movimentação e integração de dados de várias fontes.

O AWS Glue Data Quality ajuda a reduzir a necessidade de trabalho manual em atividades de qualidade de dados analisando automaticamente os dados para coletar estatísticas. O serviço usa o Deequ de código aberto para avaliar regras e medir e monitorar a qualidade de dados de data lakes na escala de petabytes. Em seguida, recomenda regras de qualidade de dados para começar a usar. Você pode atualizar as regras recomendadas ou adicionar novas regras. Se a qualidade dos dados piorar, você poderá configurar ações para alertar os usuários e detalhar a causa raiz do problema. As regras e ações de qualidade de dados também podem ser configuradas nos pipelines de dados do AWS Glue, ajudando a evitar a entrada de dados “ruins” em data lakes e data warehouses.

Agora, com essa disponibilidade geral, os clientes podem gerenciar a qualidade dos dados nas regiões AWS GovCloud (EUA). Para saber mais, acesse AWS Glue Data Quality.