AWS Glue hỗ trợ tính năng nâng cao của Apache Spark cho bảng AWS Lake Formation với quyền truy cập toàn bộ bảng
AWS Glue hiện hỗ trợ các thao tác đọc và ghi từ tác vụ AWS Glue 5.0 Apache Spark trên các bảng đã đăng ký của AWS Lake Formation khi vai trò tác vụ có quyền truy cập toàn bộ bảng. Tính năng này hỗ trợ thực hiện các hoạt động bằng Ngôn ngữ thao tác dữ liệu (DML) bao gồm các lệnh CREATE, ALTER, DELETE, UPDATE và MERGE INTO trên bảng Apache Hive và Iceberg trong cùng ứng dụng Apache Spark.
Kiểm soát truy cập chi tiết (FGAC) của Lake Formation cung cấp các biện pháp kiểm soát bảo mật chi tiết ở cấp độ hàng, cột và ô; tuy nhiên có nhiều khối lượng công việc ETL chỉ cần quyền truy cập toàn bộ bảng. Tính năng mới này cho phép các tác vụ AWS Glue 5.0 Spark trực tiếp đọc và ghi dữ liệu khi đã được cấp quyền truy cập toàn bộ bảng, loại bỏ các hạn chế trước đây từng giới hạn một vài thao tác Trích xuất, chuyển đổi và tải (ETL). Giờ đây, bạn có thể tận dụng các khả năng Spark nâng cao bao gồm Tập dữ liệu phân tán linh hoạt (RDD), thư viện tùy chỉnh và Hàm do người dùng xác định (UDF) với các bảng Lake Formation. Ngoài ra, các nhóm làm việc với dữ liệu có thể chạy ứng dụng Spark tương tác phức tạp thông qua Studio hợp nhất của SageMaker ở chế độ tương thích, đồng thời duy trì ranh giới bảo mật cấp độ bảng của Lake Formation.
Tính năng này được cung cấp ở tất cả các Khu vực AWS hỗ trợ AWS Glue và AWS Lake Formation. Để tìm hiểu thêm, hãy truy cập trang sản phẩm AWS Glue và tài liệu.