发布于: Aug 26, 2022
AWS Glue 爬网程序现可提供与过去的爬网程序执行相关的属性和指标,以简化监控和审计。这一爬网程序历史记录功能基于 AWS Glue 爬网程序构建;用户可以使用爬网程序发现数据集、提取架构信息,并填充 AWS Glue Data Catalog。
有了 AWS Glue 爬网程序历史记录功能,查看爬网程序执行、计划、数据来源、标记和用于推断数据架构信息的分类器都十分方便。爬网程序历史记录提供每个爬取的数据更改摘要,包括数据库架构更改、Amazon S3 分区更改和已用的 DPU 小时数。AWS Glue 爬网程序历史记录将显示这一功能发布后开始的爬网程序执行。