Publicado en: Apr 28, 2021
La compatibilidad nativa de Amazon Redshift con datos JSON y semiestructurados está disponible ahora de manera general. Se basa en el nuevo tipo de datos “SUPER”, que permite incorporar y almacenar los datos semiestructurados en almacenes de datos de Amazon Redshift. Amazon Redshift también incluye compatibilidad con PartiQL para acceso compatible con SQL a datos relacionales, semiestructurados y anidados. Gracias al tipo de datos SUPER y a PartiQL en Amazon Redshift, puede realizar un análisis avanzado que combina los datos SQL estructurados clásicos (como cadenas, números y marcas de tiempo) con los datos SUPER semiestructurados (como JSON) con un rendimiento, flexibilidad y facilidad de uso superiores.
El tipo de datos SUPER es de naturaleza esquemática y permite el almacenamiento de valores anidados que podrían consistir en valores escalares de Redshift, matrices anidadas u otras estructuras anidadas. Amazon Redshift admite el análisis sintáctico de los datos JSON en SUPER y una inserción hasta 5 veces más rápida de los datos JSON o SUPER en comparación con la inserción de datos similares en las columnas escalares clásicas. PartiQL es una extensión de SQL que se adopta a través de múltiples servicios AWS. PartiQL permite el acceso a datos SUPER sin esquema y anidados a través de una eficiente navegación por objetos y matrices, que deshace anidaciones y compone de forma flexible consultas con operaciones analíticas clásicas, como JOINs y agregados. Esto permite nuevos análisis avanzados que descubren combinaciones de datos estructurados y semiestructurados. Por otra parte, los ingenieros de datos pueden lograr un procesamiento ELT (Extracción, Carga, Transformación) simplificado y de baja latencia de los datos semiestructurados insertados directamente en su clúster Redshift sin integración con servicios externos. Las características de PartiQL que facilitan la ELT incluyen semántica sin esquemas, clasificaciones dinámicas y capacidades de introspección de tipos, además de la navegación y la anulación de nidos. Dichas características hacen que la incorporación y la consulta de datos sin esquemas ahora sea mucho más fácil, puesto que los usuarios no tienen que descubrir previamente los tipos de datos de cada origen incorporado, administrar esquemas en evolución o escribir SQL complejo para considerar diferentes tipos al realizar consultas de los datos. Los usuarios también pueden destruir fácilmente datos semiestructurados mediante la creación de vistas materializadas y se pueden realizar consultas analíticas más rápidas de órdenes de magnitud, a la vez que se mantienen las vistas materializadas de forma automática e gradual.
La compatibilidad nativa de Amazon Redshift con datos JSON y semiestructurados está disponible en todas las regiones comerciales.
Obtenga más información sobre la compatibilidad nativa de Amazon Redshift con datos JSON y semiestructurados en la documentación.