AWS Glue 透過完整資料表存取權提供 AWS Lake Formation 資料表的增強型 Apache Spark 功能
張貼日期:
2025年6月25日
AWS Glue 目前在工作角色具有完整資料表存取權時,支援 AWS Lake Formation 註冊表上的 AWS Glue 5.0 Apache Spark 工作讀取和寫入作業。此功能可在相同 Apache Spark 應用程式內啟用 Apache Hive 和 Iceberg 資料表上的 CREATE、ALTER、DELETE、UPDATE 和 MERGE INTO 陳述式等資料操作語言 (DML) 作業。
雖然 Lake Formation 的精細存取控制 (FGAC) 可在資料列、資料欄和儲存格層級提供細微的安全控制,但許多 ETL 工作負載僅需要完整的資料表存取權限。此新功能使 AWS Glue 5.0 Spark 工作得以在獲得完整資料表存取權時直接讀取和寫入資料,從而消除先前限制特定擷取、轉換和載入 (ETL) 操作的限制。您現在可以搭配 Lake Formation 資料表來利用進階 Spark 功能,包括彈性分散式資料集 (RDD)、自訂程式庫以及使用者定義函式 (UDF)。此外,資料團隊可以透過 SageMaker Unified Studio,以相容模式執行複雜的互動式 Spark 應用程式,同時維持 Lake Formation 的資料表層級安全邊界。
此功能適用於支援 AWS Glue 和 AWS Lake Formation 的所有 AWS 區域。若要進一步了解,請瀏覽 AWS Glue 產品頁面和文件。