Publicado: Mar 31, 2023

O AWS Glue Studio agora oferece 10 novas transformações visuais: concatenar, dividir string, matriz em colunas, adicionar carimbo de data/hora atual, linhas dinâmicas em colunas, colunas não dinâmicas em linhas, pesquisar, explodir, coluna derivada e processamento de balanceamento automático. O AWS Glue Studio oferece uma interface visual de Extract-Transform-Load (ETL – Extração, Transformação e Carga) para criar, executar e monitorar trabalhos de ETL do AWS Glue. Com esses novos componentes, os desenvolvedores de ETL podem criar rapidamente pipelines de dados mais sofisticados sem precisar escrever código.

Essas 10 novas transformações atendem a uma variedade de necessidades de processamento de dados: mesclar colunas com concatenação ou separar uma string usando um delimitador com string dividida. Adicionar o carimbo de data/hora atual permite que você registre quando seus dados foram processados. As linhas dinâmicas em colunas e as colunas não dinâmicas em linhas ajudam a reestruturar os dados para agregação. A pesquisa é uma maneira simples de adicionar colunas de outra tabela ao conjunto de dados. A coluna derivada permite definir uma nova coluna com base em outras colunas usando expressões matemáticas ou SQL. A explosão descompacta estruturas de dados aninhadas e, finalmente, o processamento de balanceamento automático é um atributo avançado que melhora a performance do trabalho quando os dados não estão bem distribuídos entre os trabalhadores. Todas essas novas transformações estão disponíveis em trabalhos visuais e baseados em código.

Esses novos componentes estão disponíveis nas mesmas regiões da AWS que o AWS Glue.

Para saber mais, acesse a documentação do AWS Glue.