发布于: Oct 22, 2019

从现在开始,您可以将您的 Glue Spark ETL 作业的作业书签倒回之前的任何作业运行。AWS Glue 可存储来自作业运行的状态信息,从而跟踪上次 ETL 作业运行期间处理的数据。这种持久保存的状态信息称为“作业书签”。

此前,您只能重置您的作业书签,以使后续作业运行再处理之前的作业运行所处理的所有数据。现在,您可以通过将您的作业书签倒回之前的任何作业运行来更好的支持数据回填场景,从而使后续作业运行只再处理已做上标签的作业运行的数据。

现在,除 AWS GovCloud(美国东部)和 AWS GovCloud(美国西部)以外,推出 AWS Glue 的所有 AWS 区域均提供此功能。

要了解有关此功能的更多信息,请访问我们的文档。