Publicado: Dec 9, 2020
O Amazon Redshift, um armazenamento de dados em nuvem totalmente gerenciado, anuncia a previsão de suporte nativo para JSON e dados semiestruturados. Ele se baseia no novo tipo de dados 'SUPER' que permite armazenar os dados semiestruturados em tabelas do Redshift. O Redshift também adicionou suporte à linguagem de consulta PartiQL para consultar e processar sem problemas os dados semiestruturados. Esta funcionalidade permite obter análises avançadas que combinam os dados SQL estruturados clássicos (como strings, valores numéricos e carimbos de data/hora) com os dados SUPER semiestruturados com desempenho superior, flexibilidade e facilidade de uso.
O tipo de dados genéricos SUPER é de natureza esquemática e permite armazenamento de valores aninhados que poderiam consistir em valores escalares do Redshift, matrizes aninhadas ou outras estruturas aninhadas. O Amazon Redshift suporta a análise de dados JSON para SUPER e a inserção de dados do JSON/SUPER até 5x mais rápida em comparação com a inserção de dados semelhantes em colunas escalares clássicas. O PartiQL é uma extensão do SQL que é adotada em vários serviços da AWS. O PartiQL permite o acesso a dados SUPER sem esquema e aninhados por meio de navegação eficiente de objetos e matriz, desaninhamento e composições flexíveis de consultas com operações analíticas clássicas como JOINs e agregados. Isso possibilita novas análises avançadas mediante consultas ad-hoc que detectam combinações de dados estruturados e semiestruturados. Além disso, os engenheiros de dados podem conseguir um processamento ELT (Extrair, Carregar, Transformar) simplificado e de baixa latência dos dados semiestruturados inseridos diretamente em seu cluster Redshift sem integração com serviços externos. As características do PartiQL que facilitam o ELT incluem semântica sem esquema, digitação dinâmica e habilidade de introspecção de tipo, além de sua navegação e desproteção. Você pode facilmente dividir os dados semiestruturados criando exibições materializadas e pode obter consultas analíticas com ordens de magnitude maiores, enquanto mantém as exibições materializadas automaticamente e de forma incremental.
O suporte ao processamento de dados nativos semiestruturados no Amazon Redshift está disponível como visualização pública no roteiro SQL_PREVIEW. Para começar e saber mais, acesse a nossa documentação. Consulte a Tabela de regiões da AWS sobre a disponibilidade do Amazon Redshift.