AWS Lake Formation mở rộng quyền truy cập ở cấp bảng để cho phép truy cập vào dữ liệu nền trong Amazon S3
AWS Lake Formation hiện cho phép bạn đọc và ghi các tệp dữ liệu nền trong Amazon S3 đối với các bảng được đăng ký trong Danh mục dữ liệu AWS Glue. Nhờ đó, bạn có một bộ quyền duy nhất cho cả các truy vấn SQL và truy cập tệp trực tiếp bằng cách sử dụng các quyền ở cấp bảng hiện có trong Lake Formation.
Với lần ra mắt này, Lake Formation cung cấp các thông tin chứng thực tạm thời và có phạm vi giới hạn cho các vị trí S3 được đăng ký dựa trên các quyền cấp bảng của bạn. Quyền SELECT cấp quyền đọc dữ liệu và quyền SUPER cấp quyền đọc và ghi dữ liệu tại vị trí đó. Tính năng này được tích hợp sẵn trong Amazon EMR phiên bản 7.13 trở lên. Do đó, bạn có thể truy cập trực tiếp các tệp dữ liệu từ công việc Spark của mình cho những tác vụ yêu cầu truy cập ở cấp độ tệp, ví dụ như đào tạo mô hình, kỹ thuật lấy dữ liệu đặc trưng hoặc gỡ lỗi các vấn đề về chất lượng dữ liệu.
Bạn cũng có thể tích hợp các ứng dụng Apache Spark hoặc Trino của mình bằng API hoặc thông qua một plugin nguồn mở do AWS cung cấp. Ngoài ra, toàn bộ hoạt động truy cập đều được ghi trong AWS CloudTrail để cung cấp biên bản kiểm tra thống nhất cho các thao tác dựa trên SQL và tệp trong các bảng của bạn.
Tính năng này có sẵn mà không tính thêm phí tại tất cả Khu vực AWS nơi AWS Lake Formation được cung cấp. Để tìm hiểu thêm, hãy xem tài liệu Lake Formation, tài liệu EMR, tài liệu tham khảo API và plugin nguồn mở.