Amazon Redshift công bố cung cấp rộng rãi Bố cục dữ liệu đa chiều
Amazon Redshift công bố việc cung cấp rộng rãi Bố cục dữ liệu đa chiều (MDDL) để tự động sắp xếp dữ liệu dựa trên bộ lọc truy vấn thực tế, làm tăng tốc hiệu suất truy vấn. Khác với các phương pháp sắp xếp truyền thống, nghĩa là sắp xếp dữ liệu dựa trên các cột cố định, MDDL sắp xếp dữ liệu dựa trên bộ lọc truy vấn (ví dụ: Doanh số tại Hoa Kỳ), giúp đạt được hiệu suất đầu cuối tốt hơn tới 10 lần so với việc chỉ sử dụng các khóa sắp xếp cột duy nhất tối ưu cho khối lượng công việc truy vấn với bộ lọc truy vấn lặp đi lặp lại.
Đối với mỗi bảng có khóa sắp xếp TỰ ĐỘNG mặc định cho các bảng không có khóa sắp xếp rõ ràng, Redshift phân tích lịch sử truy vấn của bảng và tự động chọn khóa sắp xếp cột duy nhất hoặc MDDL cho bảng, tùy thuộc vào tiềm năng cải tiến hiệu suất cho khối lượng công việc của bạn. Redshift với MDDL tự động xây dựng khóa sắp xếp ảo đa chiều để đặt các hàng thường được truy cập bởi cùng truy vấn ở cùng vị trí. Sau đó cột ảo này, tương đương với khóa sắp xếp mới cho bảng, được sử dụng trong quá trình thực thi truy vấn để bỏ qua các khối dữ liệu, thậm chí bỏ qua việc quét toàn bộ cột vị từ. Redshift với MDDL cung cấp khả năng khái quát hóa có sức biểu đạt cao hơn đối với các khóa sắp xếp ghép và xen kẽ hiện có, giúp cải thiện đáng kể hiệu suất quét bảng, đặc biệt khi khối lượng công việc truy vấn của bạn chứa các bộ lọc truy vấn lặp đi lặp lại. Đối với các bảng có sẵn với khóa sắp xếp được xác định thủ công, bạn có thể tận dụng MDDL bằng cách thay đổi khóa sắp xếp của bảng thành TỰ ĐỘNG.
MDDL có sẵn ở tất cả các khu vực thương mại AWS có Redshift. Để bắt đầu, hãy đọc tài liệu, blog và ấn phẩm Amazon Science để tìm hiểu thêm về điểm chuẩn dùng cho cải tiến hiệu suất truy vấn.