Veröffentlicht am: Dec 9, 2020
Amazon Redshift, ein vollständig verwaltetes Cloud-Data-Warehouse, kündigt eine Vorschau der einheimische Unterstützung für JSON und halb-strukturierte Daten an. Es basiert auf dem neuen Datentyp "SUPER", mit dem Sie die halb-strukturierten Daten in Redshift-Tabellen speichern können. Redshift bietet außerdem Unterstützung für die PartiQL-Abfragesprache, um die halb-strukturierten Daten nahtlos abzufragen und zu verarbeiten. Mit dieser Funktionalität können Sie erweiterte Analysen durchführen, die klassischen strukturierten SQL-Daten (wie Zeichenfolgen, Zahlen und Zeit Stempel) mit den halb-strukturierten SUPER-Daten kombinieren und dabei überlegene Leistung, Flexibilität und Benutzerfreundlichkeit bieten.
Der generische Datentyp SUPER ist schematischer Natur und ermöglicht die Speicherung verschachtelter Werte, die aus Redshift-Skalarwerten, verschachtelten Arrays oder anderen verschachtelten Strukturen bestehen können. Amazon Redshift unterstützt das Parsen von JSON-Daten in SUPER und das bis zu 5-mal schnellere Einfügen von JSON / SUPER-Daten im Vergleich zum Einfügen ähnlicher Daten in klassische skalare Spalten. PartiQL ist eine Erweiterung von SQL, die für mehrere AWS-Services verwendet wird. PartiQL ermöglicht den Zugriff auf schemenlose und verschachtelte SUPER-Daten über eine effiziente Objekt- und Array-Navigation, das Nicht-Verschachteln und das flexible Erstellen von Abfragen mit klassischen Analyse Operationen wie JOINs und Aggregaten. Dies ermöglicht neue erweiterte Analysen durch Ad-hoc-Abfragen, bei denen Kombinationen aus strukturierten und halb-strukturierten Daten ermittelt werden. Darüber hinaus können Dateningenieure eine vereinfachte ELT-Verarbeitung (Extrahieren, Laden, Transformieren) mit geringer Latenz der eingefügten halb-strukturierten Daten direkt in ihrem Redshift-Cluster erreichen, ohne sie in externe Dienste zu integrieren. Zu den PartiQL-Funktionen, die ELT ermöglichen, gehören neben der Navigation und der Unnesting auch die schemenlose Semantik, die dynamische Typisierung und Typ Prüfungsfunktionen. Sie können die halb-strukturierten Daten einfach vernichten, indem Sie materialisierte Ansichten erstellen, und um Größenordnungen schnellere analytische Abfragen erzielen, während die materialisierten Ansichten automatisch und schrittweise beibehalten werden.
Die Unterstützung für die einheimische halb-strukturierte Datenverarbeitung in Amazon Redshift ist als öffentliche Vorschau in SQL_PREVIEW verfügbar. Weitere Informationen finden Sie in unserer Dokumentation. Weitere Informationen zur Verfügbarkeit von Amazon RedShift finden Sie in der AWS-Regionentabelle.