发布于: Aug 26, 2022

AWS Glue 爬网程序现可提供与过去的爬网程序执行相关的属性和指标,以简化监控和审计。这一爬网程序历史记录功能基于 AWS Glue 爬网程序构建;用户可以使用爬网程序发现数据集、提取架构信息,并填充 AWS Glue Data Catalog。 

有了 AWS Glue 爬网程序历史记录功能,查看爬网程序执行、计划、数据来源、标记和用于推断数据架构信息的分类器都十分方便。爬网程序历史记录提供每个爬取的数据更改摘要,包括数据库架构更改、Amazon S3 分区更改和已用的 DPU 小时数。AWS Glue 爬网程序历史记录将显示这一功能发布后开始的爬网程序执行。 

AWS Glue 爬网程序历史记录功能已在所有提供 AWS Glue 的商业区域推出,详见 AWS 区域表。  要了解更多信息,请阅读爬网程序历史记录博客,并访问 AWS Glue 爬网程序文档