Anúncio de aprimoramentos da linguagem de definição de qualidade de dados (DQDL) para AWS Glue Data Quality

Publicado: 28 de jun de 2024

Os clientes usam o AWS Glue Data Quality, um recurso do AWS Glue, para medir e monitorar a qualidade dos dados. Eles criam regras de qualidade de dados usando DQDL para garantir a precisão dos dados. Os clientes precisam ter a capacidade de criar regras para cenários comerciais complexos que incluam condições de filtro e exclusão, validações de valores vazios e regras compostas. Anteriormente, os clientes usavam SQL para executar essas validações de qualidade de dados no tipo de regra CustomSQL. Hoje, o AWS Glue anuncia um novo conjunto de novos aprimoramentos na DQDL que permite que os engenheiros de dados criem facilmente regras complexas de qualidade de dados usando tipos de regras nativas. Agora, a DQDL oferece suporte para:

  • Operador NOT para que os clientes excluam determinados valores em sua regra.
  • Novas palavras-chave, como NULL, EMPTY e WHITESPACES_ONLY, para criar regras que capturam valores ausentes sem usar expressões regulares complexas.
  • Regras compostas para que os clientes criem regras comerciais sofisticadas. Agora, os clientes podem especificar opções para gerenciar a ordem de avaliação dessas regras.
  • Cláusula WHERE ao DQDL para filtrar dados antes de aplicar as regras.

Consulte o guia de DQDL para obter mais informações.

O AWS Glue Data Quality está disponível em todas as regiões comerciais que oferecem o AWS Glue. Para saber mais, acesse a página de produto do AWS Glue e a documentação.