投稿日: Aug 14, 2017

本日、AWS Glue の一般公開について発表しました。AWS Glue は、お客様による分析のためのデータの準備とロードが簡単になる、新しい完全マネージド型の ETL (抽出、変換、ロード) サービスです。AWS マネジメントコンソールから、わずか数クリックで ETL ジョブを作成し、実行できます。AWS Glue で、AWS に保存されているデータを指すだけでデータが検出され、関連するメタデータ (テーブル定義やスキーマなど) が AWS Glue データカタログに保存されます。カタログ化されたデータは、即座に検索およびクエリ可能になり、ETL に利用できます。AWS Glue により、データ変換およびデータロードプロセスを実行するコードが生成されます。

AWS Glue は、完全にカスタマイズ可能、再利用可能、移動可能な Python コードを生成します。ETL ジョブの準備ができると、AWS Glue の完全マネージド型のスケールアウト Spark 環境で実行するようスケジュールできます。AWS Glue はサーバーレスであるため、プロビジョニング、セットアップ、または管理するインフラストラクチャはありません。ジョブの完了に必要な環境が自動的にプロビジョニングされ、ジョブの実行中に消費されるコンピューティングリソースのみのお支払いで済みます。AWS Glue は ETL ジョブを管理するための柔軟性の高いスケジューラを提供し、依存性の解決、ジョブのモニタリング、アラート機能を備えています。AWS Glue により、データは数分以内に分析に利用できます。

AWS Glue は米国東部 (バージニア北部) 各リージョンで利用でき、今後数か月のうちにその他のリージョンにも拡大される予定です。詳細については、https://aws.amazon.com/glue/ を参照してください。

AWS-Glue