投稿日: Jul 25, 2023

AWS Glue Studio のビジュアル ETL ジョブでは、DataBrew レシピを変換フローのステップとして使用できるようになりました。AWS Glue Studio のビジュアル ETL は、フロー図インターフェイスを備えた、ETL 開発者向けのコード不要のジョブ作成 UI です。AWS Glue DataBrew は、スプレッドシートスタイルの UI を備えた、ビジネスユーザーやデータアナリスト向けのコード不要のデータ準備ツールです。この 2 つの新しい統合により、DataBrew ジョブのデプロイとスケーリングが容易になり、DataBrew ユーザーは DataBrew では利用できない AWS Glue の機能にアクセスできるようになります。この統合はコードベースのジョブでも機能します。

ビジネスユーザーが DataBrew でデータクレンジングと準備の「レシピ」を定義した後、テクニカルユーザーが DataBrew ジョブをデプロイしてスケールアップすることがよくあります。この新しい統合により、お客様はレシピをスケールアップしてペタバイト単位のデータを処理できるようになり、AWS Glue ジョブの価格も低く抑えることができます。DataBrew レシピは AWS Glue 4.0 で実行できます。これにより、パフォーマンスが向上し、自動スケーリングが可能になり、コストが削減されます。また、カスタム変換、増分処理、複数のデータセットの結合など、AWS Glue の機能と組み合わせてレシピを使用することもできます。

この機能は、アジアパシフィック (大阪)、中東 (バーレーン)、GovCloud、中国リージョンを除き、AWS Glue と同じ AWS リージョンで利用いただけます。

詳しくは、こちらのドキュメントおよびブログ記事をご覧ください。

2023 年 7 月 31 日 - この投稿は更新され、この機能を利用できるリージョンのリストが修正されました。