发布于: Mar 27, 2023

AWS Glue Crawler 现已在 AWS GovCloud(美国)区域支持增强型爬取功能,简化了使用 AWS Lake Formation 运行爬网程序、发现数据集以及在 AWS Glue Data Catalog 中填充模式的过程。

借助增强型爬取功能,您可以使用 Lake Formation 简化爬网程序设置,并支持集中对 AWS S3 数据湖进行账户内和跨账户爬取。您可以通过对 Glue Data Catalog 表使用 Amazon S3 事件通知来缩短爬取时间,该功能通过仅基于 Amazon S3 中的事件扫描数据简化了数据集发现过程。现在,您可以爬取更多数据来源,包括 Snowflake、MongoDB Atlas 和原生 Delta 湖表,并使用过去执行的爬网程序的成本指标,通过简化的审计进行监管。 

AWS Glue Crawler 增强型爬取功能已在所有商业区域和中国区域推出,现在又在 AWS GovCloud(美国)区域推出。要详细了解如何在数据网格架构中结合使用 Crawler 与 Lake Formation,请阅读博客和 AWS Glue Crawler 文档