Publicado: Aug 16, 2023

O AWS Glue Studio agora oferece 5 novas transformações visuais: correspondência de registros, remoção de linhas nulas, extração de fragmentos de string de uma expressão regular, análise da coluna JSON e extração do caminho JSON. O AWS Glue Studio oferece uma interface visual de Extract-Transform-Load (ETL – Extração, Transformação e Carga) para criar, executar e monitorar trabalhos de ETL do AWS Glue. Com esses novos componentes, os desenvolvedores de ETL podem criar rapidamente pipelines de dados mais sofisticados sem precisar escrever código.

Cada uma dessas 5 novas transformações atende a uma necessidade exclusiva de processamento de dados: use Remove null rows (Remover linhas nulas) para reduzir o número de linhas e manter somente aquelas com dados, selecione Extract string fragments from a regular expression (Extrair fragmentos de string de uma expressão regular) para extrair as partes relevantes de uma string e selecionar as informações relevantes, utilize os modelos de ML do Glue com correspondência de registros para identificar outras possíveis duplicatas em seu conjunto de dados, transforme strings JSON com Parse JSON column (Analisar coluna JSON) que permite converter uma string JSON em uma estrutura ou matriz de dados, ou extraia apenas o caminho JSON necessário com Extract JSON path (Extrair caminho JSON). As novas transformações estão disponíveis em trabalhos visuais e baseados em código.

Esse novo atributo agora está disponível em todas as regiões comerciais da AWS nas quais o AWS Glue é oferecido. Acesse a lista de serviços regionais da AWS para obter as informações mais atualizadas sobre disponibilidade.

Para saber mais, acesse a documentação do AWS Glue.