投稿日: Feb 17, 2021

AWS Glue で、Amazon S3 に保存されたデータを、あらかじめ AWS Glue Data Catalog に追加することなく読み込めるようになりました。この機能により、Amazon S3 内のロケーションやオブジェクトが直接データソースとして使用できるようになるので、抽出、変換、ロード (ETL) と ELT ジョブの作成が、AWS Glue Studio 内で素早く開始できます。データのスキーマは、AWS Glue によりリアルタイムで推定されます。AWS Glue Studio のビジュアルなジョブオーサリングインターフェースを使用しての、データ変換の定義も簡単です。

これまで、AWS Glue Studio 内で AWS Glue Data Catalog テーブルをデータソースとして使用する際には、まず、データに対し AWS Glue クローラーを実行するか、Data Catalog に手動でテーブルを追加していました。今後は、ビジュアルなジョブオーサリングインターフェースを使用して、直接 Amazon S3 内のロケーションやファイルを指定するだけですみます。データのスキーマは、AWS Glue Studio により推定され表示されます。それぞれのジョブが実行される際に、直接 Amazon S3 バケットからの読み込みが行われ、スキーマの変更点が反映されます。

AWS Glue Studio は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (香港)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (ミラノ)、欧州 (パリ)、欧州 (ストックホルム)、中東 (バーレーン)、南米 (サンパウロ) の各 AWS リージョンでご利用いただけます。

この機能の詳細については、ドキュメントをご覧ください。