投稿日: Jan 16, 2020

AWS Glue は、Apache Spark アプリケーションで抽出、変換、ロード (ETL) ロジックを拡張するのに役立つ 3 つの新しい変換 (消去、移行、結合) をサポートするようになりました。消去変換を使用して、ファイル、パーティション、またはテーブルを削除し、S3 のデータセットをすばやく調整できます。

移行変換を使用して、ファイル、パーティション、またはテーブルを下位の S3 ストレージクラスに移行できます。AWS Glue S3 ストレージクラスの除外を使用して、Glue ETL ジョブの特定の S3 ストレージクラスから読み取りファイルまたはパーティションを除外することもできます。結合変換を使用して、プライマリキーに基づいて S3、Redshift、Dynamo、または JDBC ソースのデータを表す複数の Glue ダイナミックフレームを結合できます。詳細については、消去移行結合のドキュメントをご覧ください。

この機能は、AWS Glue が利用できるすべてのリージョンで利用可能です。