Amazon EMR 7.12 hiện đã hỗ trợ định dạng bảng Apache Iceberg v3

Ngày đăng: 21 Th11 2025

Amazon EMR 7.12 hiện đã có thể sử dụng với định dạng bảng Apache Iceberg v3 mới với Apache Iceberg 1.10. Bản phát hành này giúp bạn giảm chi phí khi xóa dữ liệu, tăng cường khả năng quản trị và tuân thủ thông qua việc theo dõi tốt hơn cho các thay đổi cấp hàng đồng thời tăng cường độ bảo mật dữ liệu bằng mức độ kiểm soát quyền truy cập dữ liệu chi tiết hơn.

Iceberg v3 giúp bạn tiết kiệm chi phí khi xóa dữ liệu bằng cách đánh dấu các hàng bị xóa mà không cần viết lại toàn bộ tệp - vừa tăng tốc quy trình dữ liệu vừa giảm chi phí lưu trữ cho bạn. Việc theo dõi tự động lịch sử tạo và sửa đổi của từng hàng, tạo ra biên bản kiểm tra cần thiết để đáp ứng yêu cầu quy định và thu thập dữ liệu thay đổi mang đến cho bạn khả năng quản trị và tuân thủ tốt hơn. Bảo mật dữ liệu được tăng cường bằng mã hóa cấp bảng, giúp bạn đáp ứng các quy định về quyền riêng tư cho dữ liệu nhạy cảm nhất của mình.

Với Apache Spark 3.5.6 bao gồm trong bản phát hành này, bạn có thể tận dụng các khả năng Iceberg 1.10 này để xây dựng kiến trúc hồ dữ liệu mạnh mẽ trên Amazon S3. Bản phát hành này cũng bao gồm tính năng hỗ trợ cho thao tác quản trị dữ liệu trên bảng Iceberg bằng cách sử dụng AWS Lake Formation. Ngoài ra, bản phát hành này cũng bao gồm Apache Trino 476.

Amazon EMR 7.12 được cung cấp ở tất cả các Khu vực AWS hỗ trợ Amazon EMR. Để tìm hiểu thêm về bản phát hành Amazon EMR 7.12, hãy truy cập tài liệu về bản phát hành Amazon EMR 7.12