投稿日: Mar 30, 2021
AWS Glue は、分析、機械学習、アプリケーション開発のためのデータの検出、準備、結合を簡単に行うことのできるサーバーレスデータ統合サービスです。AWS Glue ワークフローを使用して、複雑なマルチジョブ、マルチクローラーのデータ統合ワークフローを調整および実行することができます。AWS Glue カスタムブループリントを使用すれば、データエンジニアは繰り返し可能な AWS Glue ワークフローを簡単に作成できます。
AWS Glue ブループリントを開始する前に、繰り返し可能なデータ統合ワークフローを特定します。たとえば、生の S3 バケットの CSV データを本稼働環境の S3 バケットで Parquet 形式に変換する ETL ワークフローで、この ETL ワークフローを異なる AWS アカウントで複数回実行する必要があります。ETL プロセスごとに 1 つのワークフローを作成する代わりに、S3 バケットを入力パラメータとして受け入れる AWS Glue ブループリントを作成して登録することができます。データアナリストは、入力パラメータ (データソースやターゲットなど) を提供するだけで、新しいデータ統合ワークフローを作成できます。
AWS Glue ブループリントの公開プレビューは、AWS Glue が利用可能なすべてのリージョンで利用できます。詳細については、AWS Glue ユーザーガイドをご参照ください。使用するには、AWS Glue コンソールにアクセスしてください。