投稿日: Mar 27, 2023

AWS Glue Crawler は、 AWS GovCloud (米国) リージョンで強化されたクロール機能をサポートするようになりました。これにより、AWS Lake Formation によるクローラーの実行、データセットの検出、AWS Glue Data Catalog へのスキーマの投入が簡素化されます。

強化されたクローリング機能により、Lake Formation を使用してクローラーのセットアップを簡素化し、AWS S3 データレイクのアカウント内およびクロスアカウントクローリングの権限を一元管理することができます。Glue Data Catalog テーブルの Amazon S3 イベント通知を使用することで、クロール時間を短縮できます。この機能は、Amazon S3 のイベントに基づくデータのみをスキャンすることで、データセットの検出を簡素化するものです。Snowflake、MongoDB Atlas、ネイティブ Delta Lake テーブルなど、より多くのデータソースをクロールできるようになり、過去のクローラー実行のコストメトリクスによる簡素な監査で管理できるようになりました。 

AWS Glue Crawler の強化されたクロール機能は、すでにすべての商用リージョン、中国リージョン、そして現在は AWS GovCloud (米国) リージョンでご利用いただけます。データメッシュアーキテクチャでクローラーと Lake Formation を使用する方法の詳細については、ブログやAWS Glue Crawler のドキュメントをご覧ください。