Veröffentlicht am: Apr 28, 2021
Die native Unterstützung von JSON und halb-strukturierten Daten durch Amazon Redshift steht jetzt allgemein zur Verfügung. Es basiert auf dem neuen Datentyp „SUPER“, mit dem Sie halb-strukturierte Daten in Ihre Amazon Redshift Data Warehouses aufnehmen und speichern können. Amazon Redshift unterstützt außerdem PartiQL für einen SQL-kompatiblen Zugriff auf relationale, halb-strukturierte und verschachtelte Daten. Mit dem Datentyp SUPER und PartiQL in Amazon Redshift können Sie erweiterte Analysen durchführen, die klassischen strukturierten SQL-Daten (z. B. Zeichenfolgen, Zahlen und Zeitstempel) mit den halb-strukturierten SUPER-Daten (z. B. JSON) mit überlegener Leistung, Flexibilität und Benutzerfreundlichkeit kombinieren.
Der Datentyp SUPER ist schematischer Natur und ermöglicht die Speicherung verschachtelter Werte, die aus Redshift-Skalarwerten, verschachtelten Arrays oder anderen verschachtelten Strukturen bestehen können. Amazon Redshift unterstützt das Parsen von JSON-Daten in SUPER und das bis zu 5-mal schnellere Einfügen von JSON / SUPER-Daten im Vergleich zum Einfügen ähnlicher Daten in klassische skalare Spalten. PartiQL ist eine Erweiterung von SQL, die für mehrere AWS-Services verwendet wird. PartiQL ermöglicht den Zugriff auf schemenlose und verschachtelte SUPER-Daten über eine effiziente Objekt- und Array-Navigation, das Nicht-Verschachteln und das flexible Erstellen von Abfragen mit klassischen Analyse Operationen wie JOINs und Aggregaten. Dies ermöglicht neue erweiterte Analysen, bei denen Kombinationen aus strukturierten und halb-strukturierten Daten ermittelt werden. Dateningenieure können eine vereinfachte ELT-Verarbeitung (Extrahieren, Laden, Transformieren) mit geringer Latenz der eingefügten halb-strukturierten Daten direkt in ihrem Redshift-Cluster erreichen, ohne sie in externe Dienste zu integrieren. Zu den PartiQL-Funktionen, die ELT ermöglichen, gehören neben der Navigation und der Unnesting auch die schemenlose Semantik, die dynamische Typisierung und Typ-Prüfungsfunktionen. Dadurch wird das Einlesen und Abfragen von schemalosen Daten viel einfacher, da die Benutzer nicht mehr die Datentypen für jede eingelesene Quelle vorab ermitteln, mit sich entwickelnden Schemata umgehen oder komplexes SQL schreiben müssen, um bei der Abfrage der Daten verschiedene Typen zu berücksichtigen. Benutzer können die halb-strukturierten Daten einfach vernichten, indem Sie materialisierte Ansichten erstellen, und um Größenordnungen schnellere analytische Abfragen erzielen, während die materialisierten Ansichten automatisch und schrittweise beibehalten werden.
Die native Unterstützung für JSON und halb-strukturierte Daten in Amazon Redshift ist in allen kommerziellen Regionen verfügbar
Weitere Informationen zur nativen Unterstützung von JSON und halb-strukturierten Daten in Amazon Redshift finden Sie in der Dokumentation.