投稿日: Dec 9, 2020
フルマネージド型のクラウドデータウェアハウスである Amazon Redshift は、JSON および半構造化データのネイティブサポートのプレビューを発表しました。これは、半構造化データを Redshift テーブルに保存できる新しいデータタイプ「SUPER」に基づいています。Redshift は、半構造化データをシームレスにクエリおよび処理するための PartiQL クエリ言語のサポートも追加します。この機能により、従来の構造化 SQL データ (文字列、数値、タイムスタンプなど) と半構造化 SUPER データを組み合わせて、優れたパフォーマンス、柔軟性、および使いやすさを備えた高度な分析を実現できます。
汎用データ型 SUPER は本質的にスキーマレスであり、Redshift スカラー値、ネストされた配列、またはその他のネストされた構造体で構成されるネストされた値の保存を可能にします。Amazon Redshift は、JSON データの SUPER への解析と、同様のデータを従来のスカラー列に挿入する場合と比較して、JSON/SUPER データの挿入を最大 5 倍高速化するようサポートしています。PartiQL は、複数の AWS サービスで採用されている SQL の拡張機能です。PartiQL を使用すれば、効率的なオブジェクトと配列のナビゲーション、ネスト解除、および JOIN や集計などの従来の分析操作を使用した柔軟な構成クエリを介してスキーマレスおよびネストされた SUPER データにアクセスできます。これにより、構造化データと半構造化データの組み合わせを検出するアドホッククエリを通じて、新しい高度分析が可能になります。さらに、データエンジニアは、外部サービスと統合することなく、Redshift クラスターに直接挿入された半構造化データの簡素化された低レイテンシーで ELT (抽出、ロード、変換) 処理を実現できます。ELT を容易にする PartiQL 機能には、ナビゲーションとネスト解除に加えて、スキーマレスセマンティクス、動的型付け、型イントロスペクション機能が含まれます。マテリアライズドビューを作成することで半構造化データを簡単に細断処理でき、マテリアライズドビューを自動的かつ段階的に保ちながら、桁違いで高速な分析クエリを実行できます。
Amazon Redshift でのネイティブの半構造化データ処理のサポートは、SQL_PREVIEW トラックのパブリックプレビューとして利用できます。使用開始方法および詳細については、ドキュメントをご参照ください。Amazon Redshift を利用できるリージョンについては、AWS リージョン表をご覧ください。