Publié le: Apr 28, 2021
La prise en charge native dans Amazon Redshift des données JSON et semi-structurées est désormais disponible pour tous. Elle repose sur le nouveau type de données « SUPER » qui permet d'ingérer et de stocker les données semi-structurées dans des entrepôts de données Amazon Redshift. Amazon Redshift prend également en charge PartiQL pour un accès compatible avec SQL aux données relationnelles, semi-structurées et imbriquées. En utilisant le type de données SUPER et PartiQL dans Amazon Redshift, vous pouvez réaliser des analyses avancées qui combinent des données SQL structurées classiques (telles que les chaînes de caractères, les données numériques et les horodatages) et les données SUPER semi-structurées (telles que JSON) avec des performances, une flexibilité et une facilité d'utilisation supérieures.
Le type de données SUPER est par essence sans schéma et permet de stocker les valeurs imbriquées qui pourraient être constituées de valeurs scalaires Redshift, de tableaux imbriqués ou d'autres structures imbriquées. Amazon Redshift prend en charge l'analyse des données JSON dans SUPER et insère cinq fois plus rapidement les données JSON/SUPER par rapport à l'insertion de données similaires dans des colonnes scalaires classiques. PartiQL est une extension de SQL qui est adoptée par de nombreux services AWS. PartiQL permet d'accéder à des données SUPER sans schéma et imbriquées grâce à une navigation dans les objets et les tableaux, en supprimant l'imbrication et en composant de manière flexible des requêtes avec des opérations analytiques classiques telles que les opérations JOIN et les agrégats. Cela permet d'exécuter de nouvelles analyses avancées qui découvrent des combinaisons de données structurées et semi-structurées. Les ingénieurs de données peuvent réaliser un traitement ELT (Extract, Load, Transform) simplifié et à faible latence des données semi-structurées insérées directement dans leur cluster Redshift sans intégration avec des services externes. Les fonctions PartiQL qui facilitent le traitement ELT incluent une sémantique sans schéma, des fonctionnalités de typage dynamique et d'introspection de type en plus de sa navigation et de la suppression des imbrications. Elles facilitent grandement l'ingestion et la requête de données sans schéma maintenant que les utilisateurs n'ont plus à pré-identifier les types de données pour chaque source ingérée, traiter de schémas évolutifs ou écrire des requêtes SQL complexes au compte pour différents types lorsqu'ils demandent les données. Les utilisateurs peuvent aussi facilement supprimer les données semi-structurées en créant des vues matérialisées et exécuter des requêtes analytiques plus rapides d'un ordre de grandeur, tout en conservant les vues matérialisées automatiquement et de manière incrémentielle.
La prise en charge native des données JSON et semi-structurées dans Amazon Redshift est disponible dans toutes les régions commerciales
Consultez la documentation pour en savoir plus sur la prise en charge native des données JSON et semi-structurées dans Amazon Redshift.