Amazon Redshift hiện hỗ trợ Just-In-Time (JIT) ANALYZE cho các bảng Apache Iceberg

Ngày đăng: 18 Th11 2025

Hôm nay, Amazon Redshift công bố việc cung cấp rộng rãi khả năng Just-In-Time (JIT) ANALYZE cho bảng Apache Iceberg, cho phép người dùng chạy truy vấn phân tích đọc và ghi hiệu năng cao trên bảng Apache Iceberg trong hồ dữ liệu Redshift. Định dạng bảng mở Apache Iceberg đã được nhiều khách hàng sử dụng để đơn giản hóa hoạt động xử lý dữ liệu trên các bảng mở rộng và phát triển nhanh chóng được lưu trữ trong hồ dữ liệu.

Không giống như kho dữ liệu truyền thống, hồ dữ liệu thường thiếu thống kê cấp bảng và cấp cột toàn diện về dữ liệu cơ bản, khiến các công cụ truy vấn khó chọn kế hoạch thực thi truy vấn tối ưu nhất mà không có khả năng hiển thị trong số liệu thống kê bảng và cột. Các kế hoạch thực thi truy vấn dưới mức tối ưu có thể dẫn đến hiệu năng chậm hơn và dự đoán ít hơn.

'JIT ANALYZE' là một tính năng mới của Amazon Redshift tự động thu thập và sử dụng số liệu thống kê cho các bảng Iceberg trong quá trình thực thi truy vấn, loại bỏ việc thu thập số liệu thống kê thủ công đồng thời cung cấp thông tin cần thiết cho công cụ truy vấn để tạo kế hoạch thực thi truy vấn tối ưu. Hệ thống sử dụng phương pháp nghiên cứu thông minh để xác định các truy vấn sẽ được hưởng lợi từ số liệu thống kê, duy trì cấu trúc dữ liệu phác thảo nhẹ và xây dựng số liệu thống kê cấp bảng và cấp cột chất lượng cao. JIT ANALYZE cung cấp hiệu năng vượt trội ngang với các truy vấn có số liệu thống kê được tính toán trước, đồng thời cung cấp nền tảng cho nhiều tối ưu hóa hiệu năng khác.

Tính năng Amazon Redshift JIT ANALYZE dành cho bảng Apache Iceberg hiện có sẵn ở tất cả các khu vực AWS cung cấp Amazon Redshift. Người dùng không cần thực hiện bất kỳ thay đổi nào hoặc bật bất kỳ cài đặt nào để tận dụng khả năng tối ưu hóa truy vấn hồ dữ liệu mới này. Để bắt đầu, hãy truy cập trang tài liệu về Hướng dẫn quản lý Amazon Redshift.