投稿日: Aug 16, 2023

AWS Glue Studio には、[Record matching]、[Remove null rows]、[Extract string fragments from a regular expression]、[Parse JSON column]、および [Extract JSON path] という 5 つの新しいビジュアル変換が追加されました。AWS Glue Studio は、抽出、変換、ロード (ETL) を行うためのビジュアルインターフェイスであり、AWS Glue の ETL ジョブを作成、実行、モニタリングするのに役立ちます。これらの新しいコンポーネントにより、ETL 開発者はコードを書かなくても、より高度なデータパイプラインを迅速に構築できます。

これらの 5 つの新しい変換はそれぞれ、固有のデータ処理ニーズに対応しています。[Remove null rows] を使用して行数を減らし、データを含む行のみを残します。[Extract string fragments from a regular expression] を選択して文字列の関連部分を抽出し、関連情報を選択します。Glue の ML モデルを [Record matching] で利用して、データセット内の他の潜在的な重複を識別します。JSON 文字列を [Parse JSON column] で変換することで、JSON 文字列をデータ構造体または配列に変換できます。あるいは、[Extract JSON path] を使用して必要な JSON パスだけを抽出します。これらの新しい変換は、ビジュアルベースのジョブとコードベースのジョブの両方で使用できます。

この新機能は、AWS Glue が利用できるすべての AWS 商用リージョンで利用可能です。サービスの利用可否に関する最新情報については、AWS リージョン別サービス表にアクセスしてください

詳細については、AWS Glue のドキュメントをご覧ください。