Publicado: Apr 28, 2021
O suporte nativo do Amazon Redshift para dados JSON e semi-estruturados agora está disponível para o público em geral. Ele é baseado no novo tipo de dados “SUPER”, que permite a ingestão e o armazenamento de dados semiestruturados em data warehouses do Amazon Redshift. O Amazon Redshift também inclui suporte para PartiQL para acesso compatível com SQL a dados relacionais, semiestruturados e aninhados. Usando o tipo de dados SUPER e o PartiQL no Amazon Redshift, você pode executar análises avançadas que combinam dados SQL estruturados clássicos (como string, numérico e timestamp) com os dados SUPER semiestruturados (como JSON) com níveis superiores de performance, flexibilidade e facilidade de uso.
O tipo de dados SUPER não tem esquema por natureza e permite o armazenamento de valores aninhados que podem consistir em valores escalares, matrizes aninhadas ou outras estruturas aninhadas do Redshift. O Amazon Redshift suporta a análise de dados JSON para SUPER e a inserção de dados do JSON/SUPER até 5x mais rápida em comparação com a inserção de dados semelhantes em colunas escalares clássicas. O PartiQL é uma extensão do SQL que é adotada em vários serviços da AWS. O PartiQL permite o acesso a dados SUPER sem esquema e aninhados por meio de navegação eficiente de objetos e matriz, desaninhamento e composições flexíveis de consultas com operações analíticas clássicas como JOINs e agregados. Isso permite novas análises avançadas que descobrem combinações de dados estruturados e semiestruturados. Os engenheiros de dados podem conseguir um processamento ELT (Extrair, Carregar, Transformar) simplificado e de baixa latência dos dados semiestruturados inseridos diretamente em seus clusters Redshift sem integração com serviços externos. Os recursos do PartiQL que facilitam o ELT incluem semântica sem esquema, digitação dinâmica e habilidade de introspecção de tipo, além de sua navegação e desproteção. Isso facilita muito a ingestão e a consulta de dados sem esquema agora que os usuários não precisam pré-descobrir tipos de dados para cada fonte ingerida, manipular esquemas em evolução ou escrever SQL complexo para levar em conta diferentes tipos ao consultar os dados. Você pode dividir facilmente os dados semiestruturados criando exibições materializadas e pode obter consultas analíticas com ordens de magnitude maiores, enquanto mantém as exibições materializadas automaticamente e de forma incremental.
O suporte nativo para JSON e dados semiestruturados no Amazon Redshift está disponível em todas as regiões comerciais
Saiba mais sobre o suporte nativo para JSON e dados semiestruturados no Amazon Redshift na documentação.