張貼日期: Jul 26, 2019
即日起,您可以維護 Glue ETL 任務中 Parquet 和 ORC 格式的任務書籤 (使用 Glue 版本 1.0)。AWS Glue 可存放任務執行的狀態資訊,追蹤上次執行 ETL 任務時處理的資料。這種持續的狀態資訊稱為任務書籤。任務書籤可協助 AWS Glue 維護狀態資訊,避免重新處理舊資料。
之前,您只能在一般 S3 來源格式設定書籤,如 JSON、CSV、Apache Avro 和 XML。
除 AWS GovCloud (美國東部) 和 AWS GovCloud (美國西部) 外,提供 AWS Glue 的所有區域均可使用此功能。
若要進一步了解此功能,請參閱我們的文件。