Publicado: May 27, 2021
Agora o AWS Glue DataBrew é compatível com transformações de aninhamento e desaninhamento para ajudar os usuários a empacotar ou desempacotar dados em colunas a fim de manipular seus conjuntos de dados. Com essas transformações, os usuários passam a poder extrair facilmente os dados de campos aninhados de cadeia de caracteres json sem a necessidade de criar código.
Para aninhar dados, os usuários podem escolher em uma lista de colunas de origem e compactá-las em um formato de struct, mapa ou matriz. Para desaninhar dados, os usuários podem desempacotar dados aninhados de uma matriz, mapa, struct ou coluna de cadeia de caracteres para criar novas linhas ou colunas. Também é possível aplicar operações de desaninhamento em vários níveis de dados de entrada em json. Além disso, os usuários também podem extrair a chave/valor para colunas de cadeia de caracteres aninhadas a fim de criar colunas distintas, e alterar as colunas existentes de cadeia de caracteres json, transformando-as em colunas de matriz ou struct. Saiba mais sobre transformações de estrutura de dados aqui.
O AWS Glue DataBrew é uma ferramenta visual de preparação de dados que facilita a limpeza e a normalização de dados usando mais de 250 transformações predefinidas para preparação de dados, sem a necessidade de criar código.
Para começar, acesse o Console de Gerenciamento da AWS ou instale o plug-in do DataBrew em seu ambiente de bloco de anotações e consulte a documentação do DataBrew sobre todas as transformações disponíveis.