Amazon EMR trên EC2 bổ sung khả năng hỗ trợ FGAC gốc của Apache Spark và chế độ xem danh mục dữ liệu AWS Glue

Ngày đăng: 29 Th08 2025

Amazon EMR trên EC2 công bố hai điểm cải tiến quan trọng cho hoạt động quản trị: khả năng kiểm soát truy cập chi tiết gốc trên Apache Spark (FGAC) thông qua AWS Lake Formation và sự hỗ trợ chế độ xem Danh mục dữ liệu AWS Glue. Các tính năng này cho phép tổ chức cải thiện khả năng bảo mật dữ liệu, đơn giản hóa việc quản lý quyền truy cập và nâng cao khả năng chia sẻ dữ liệu trên các môi trường phân tích của họ.

Với phần triển khai FGAC gốc của Apache Spark, khách hàng có thể xác định chính sách quyền truy cập chi tiết một lần trong AWS Lake Formation và áp dụng chúng một cách nhất quán trên các cụm EMR. Điều này làm giảm rủi ro bảo mật và chi phí quản trị, đồng thời mang đến một cách tiếp cận thống nhất để quản trị dữ liệu. Giờ đây, khách hàng có thể sử dụng các câu lệnh cấp và thu hồi quen thuộc của Lake Formation để quản lý biện pháp kiểm soát truy cập cho các công việc Spark và phiên tương tác trên EMR trên EC2, tương tự như cách thức cho các dịch vụ phân tích AWS khác.

Với chế độ xem Danh mục dữ liệu AWS Glue, khách hàng có thể tạo, quản lý và truy vấn chế độ xem SQL đa công cụ giữa các khu vực, tài khoản và tổ chức AWS. Tính năng này cho phép quản trị viên tạo chế độ xem từ các công việc Spark có thể được truy vấn từ nhiều công cụ, đồng thời kiểm soát quuyền truy cập dữ liệu thông qua quyền Lake Formation. Các quyền này bao gồm quyền cấp tài nguyên được đặt tên, bộ lọc dữ liệu và thẻ, với tất cả các yêu cầu truy cập được đăng nhập tự động AWS CloudTrail để kiểm tra toàn diện.

Các tính năng xem Danh mục dữ liệu Glue và FGAC gốc của Apache Spark được cung cấp với bản phát hành Amazon EMR 7.10 ở tất cả các Khu vực AWS có EMR trên EC2. Để tìm hiểu thêm, hãy truy cập Sử dụng AWS Lake Formation với Amazon EMRLàm việc với chế độ xem danh mục dữ liệu AWS Glue trong tài liệu về Amazon EMR.