投稿日: Apr 28, 2021
Amazon Redshift の JSON と半構造化データのネイティブサポートが一般提供されました。これは、半構造化データを Amazon Redshift データウェアハウスに保存できる新しいデータタイプ「SUPER」に基づいています。Amazon Redshift には、リレーショナルデータ、半構造化データ、ネストされたデータへの SQL 互換アクセスのための PartiQL のサポートも含まれています。Amazon Redshift の SUPER データ型 と PartiQL を使用すると、従来の構造化 SQL データ (文字列、数値、タイムスタンプなど) と半構造化 SUPER データ (JSONなど) を組み合わせて、優れたパフォーマンス、柔軟性、および使いやすさを備えた高度な分析を実現できます。
SUPER データ型 は本質的にスキーマレスであり、Redshift スカラー値、ネストされた配列、またはその他のネストされた構造体で構成されるネストされた値の保存を可能にします。Amazon Redshift は、JSON データの SUPER への解析と、同様のデータを従来のスカラー列に挿入する場合と比較して、JSON/SUPER データの挿入を最大 5 倍高速化するようサポートしています。PartiQL は、複数の AWS サービスで採用されている SQL の拡張機能です。PartiQL を使用すれば、効率的なオブジェクトと配列のナビゲーション、ネスト解除、および JOIN や集計などの従来の分析操作を使用した柔軟な構成クエリを介してスキーマレスおよびネストされた SUPER データにアクセスできます。これにより、構造化データと半構造化データの組み合わせを検出する新しい高度分析が可能になります。データエンジニアは、外部サービスと統合することなく、Redshift クラスターに直接挿入された半構造化データの簡素化された低レイテンシーで ELT (抽出、ロード、変換) 処理を実現できます。ELT を容易にする PartiQL 機能には、ナビゲーションとネスト解除に加えて、スキーマレスセマンティクス、動的型付け、型イントロスペクション機能が含まれます。これらの機能により、スキーマレスデータの取り込みとクエリがはるかに簡単になります。ユーザーは、取り込みたソースごとにデータ型を事前に調べたり、進化するスキーマを処理したり、データをクエリするときにさまざまな型を考慮して複雑なSQLを記述したりする必要がありません。また、ユーザーはマテリアライズドビューを作成することで半構造化データを簡単に細断処理でき、マテリアライズドビューを自動的かつ段階的に保ちながら、桁違いで高速な分析クエリを実行できます。
Amazon Redshift での JSON および半構造化データのネイティブサポートは、すべての商用リージョンで利用できます
ドキュメントで、Amazon Redshift での JSON および 半構造化データのネイティブサポートの詳細をご覧ください。