投稿日: May 27, 2021

AWS Glue DataBrew は、ユーザーがデータを圧縮・解凍してデータセットを操作できるように、ネストおよびアンネストの変換をサポートするようになりました。これらの変換により、ネストされた JSON の文字列フィールドからデータを簡単に抽出、あるいはコードを記述することなくデータの結合ができるようになりました。

データをネストするには、ソースカラムのリストから選択して、データを構造体、マップ、配列形式に圧縮します。データをアンネストするには、新たに行またはカラムを作成するため、配列、マップ、構造体、文字列カラムからネストされたデータを解凍します。ユーザーは JSON の入力データの複数レベルにアンネスト操作ができます。さらに、カラムを別に作成するためにネストされた文字列カラムの key=value を抽出し、既存の JSON の文字列カラムを配列または構造体の各カラムに変換します。詳細についてデータ構造変換はこちら

AWS Glue DataBrew は、事前構築済みの 250 以上の変換を使用して、コードを記述することなくデータを簡単にクリーニングし、正規化できるビジュアルデータ準備ツールです。

AWS マネジメントコンソール にアクセスしたり、ノートブック環境に DataBrew プラグイン をインストールしたり、利用可能なすべての変換に関する DataBrew のドキュメントをご参照したりして、使用を開始してください。