AWS Glue hiện hỗ trợ chế độ xem cụ thể hóa dựa trên Apache Iceberg
AWS Glue hiện hỗ trợ chế độ xem cụ thể hóa, một khả năng mới giúp các nhóm dữ liệu biến đổi dữ liệu và thúc đẩy hiệu suất truy vấn dễ dàng hơn. Chế độ xem cụ thể hóa là các bảng được quản lý trong Danh mục dữ liệu AWS Glue, lưu trữ các kết quả truy vấn được điện toán trước ở định dạng Apache Iceberg và được cập nhật tự động khi dữ liệu nguồn thay đổi. Tính năng này được thiết kế để giúp các kỹ sư dữ liệu và nhóm phân tích dễ dàng biến đổi dữ liệu qua nhiều giai đoạn, từ dữ liệu thô đến bảng phân tích cuối cùng, đồng thời giảm nỗ lực kỹ thuật và chi phí vận hành.
Giờ đây, khách hàng có thể tạo các chế độ xem cụ thể hóa bằng cú pháp Spark SQL tiêu chuẩn với lịch làm mới dữ liệu. Dịch vụ sẽ tự động xử lý lịch làm mới, phát hiện sự thay đổi, dữ liệu cập nhật gia tăng và quản lý cơ sở hạ tầng điện toán. Các công cụ Spark trên Amazon Athena, Amazon EMR và AWS Glue viết lại các truy vấn một cách thông minh để sử dụng các chế độ xem cụ thể hóa này, tăng hiệu suất lên đến 8 lần và giảm chi phí điện toán. Bạn có thể sử dụng các công cụ truy vấn SQL như Athena và Redshift để truy cập các chế độ xem cụ thể hóa dưới dạng bảng Iceberg từ trình chỉnh sửa SQL và sổ tay Amazon SageMaker.
Chế độ xem cụ thể hóa trong AWS Glue được cung cấp ở Châu Âu (Stockholm), Châu Á Thái Bình Dương (Thái Lan), Châu Á Thái Bình Dương (Mumbai), Châu Âu (Paris), Miền Đông Hoa Kỳ (Ohio), Châu Âu (Ireland), Châu Âu (Frankfurt), Nam Mỹ (Sao Paulo), Châu Á Thái Bình Dương (Hồng Kông), Miền Đông Hoa Kỳ (Bắc Virginia), Châu Á Thái Bình Dương (Seoul), Châu Á Thái Bình Dương (Malaysia), Châu Âu (London), Châu Á Thái Bình Dương (Tokyo), Miền Tây Hoa Kỳ (Oregon), Miền Tây Hoa Kỳ (Bắc California), Châu Á Thái Bình Dương (Singapore), Châu Á Thái Bình Dương (Sydney), Canada (Miền Trung) và Châu Âu (Tây Ban Nha). Để tìm hiểu thêm, hãy truy cập Làm việc với Chế độ xem cụ thể hóa trong hướng dẫn dành cho nhà phát triển về AWS Glue.