Amazon Redshift が半構造化データ処理のための新しい配列関数を導入
Amazon Redshift では、SUPER データ型で保存された半構造化データを処理するための 9 つの新しい配列関数がサポートされるようになりました。新しい関数には、ARRAY_CONTAINS、ARRAY_DISTINCT、ARRAY_EXCEPT、ARRAY_INTERSECTION、ARRAY_POSITION、ARRAY_POSITIONS、ARRAY_SORT、ARRAY_UNION、および ARRAYS_OVERLAP が含まれます。これらにより、SQL クエリ内で配列の検索、比較、ソート、変換を直接行えます。以前は、これらの操作を実行するには複雑なカスタム PartiQL SQL ロジックを記述する必要がありました。
これらの関数は、単一の SQL ステートメントでの高度な配列操作を可能にすることで、複雑なデータ変換を簡素化し、クエリの複雑さを軽減します。例えば、要素検索には ARRAY_CONTAINS と ARRAY_POSITION、セット演算には ARRAY_INTERSECTION と ARRAY_EXCEPT、データの整理と重複排除には ARRAY_SORT と ARRAY_DISTINCT を使用できます。これらの関数は、データを大規模に集約、フィルタリング、または変換する必要があるネストされたデータ構造、イベント処理、分析ワークフローを含むアプリケーションで特に役立ちます。
新しい Amazon Redshift 配列関数は、Amazon Redshift が利用可能な AWS GovCloud (米国) リージョンを含むすべての AWS リージョンで利用できます。詳細については、ドキュメントをご覧ください。