Danh mục dữ liệu AWS Glue hiện đã hỗ trợ tính năng tự động tối ưu hóa bảng Apache Iceberg thông qua Amazon VPC

Ngày đăng: 21 Th11 2024

Danh mục dữ liệu AWS Glue hiện đã hỗ trợ tính năng tự động tối ưu hóa các bảng Apache Iceberg chỉ có thể truy cập từ môi trường Amazon Virtual Private Cloud (VPC) cụ thể. Bạn có thể bật tính năng tự động tối ưu hóa bằng cách cung cấp cấu hình VPC để tối ưu hóa kho lưu trữ và cải thiện hiệu suất truy vấn trong khi vẫn đảm bảo tính bảo mật cho bảng.

Danh mục dữ liệu AWS Glue hỗ trợ nén, lưu giữ ảnh chụp nhanh và quản lý tệp không có tham chiếu giúp bạn giảm chi phí siêu dữ liệu, kiểm soát chi phí lưu trữ và cải thiện hiệu suất truy vấn. Khách hàng có cấu hình quản trị và bảo mật yêu cầu phải có vùng lưu trữ Amazon S3 nằm trong VPC cụ thể giờ đây có thể sử dụng vùng lưu trữ đó với Danh mục Glue. Nhờ đó, bạn sẽ có thêm nhiều tính năng hơn để tự động quản lý dữ liệu Apache Iceberg, bất kể dữ liệu đó được lưu trữ ở đâu trên Amazon S3.

Tính năng tối ưu hóa tự động cho bảng Iceberg thông qua Amazon VPC hiện được cung cấp ở 13 khu vực AWS: Miền Đông Hoa Kỳ (Bắc Virginia, Ohio), Miền Tây Hoa Kỳ (Oregon), Châu Âu (Ireland, London, Frankfurt, Stockholm), Châu Á Thái Bình Dương (Tokyo, Seoul, Mumbai, Singapore, Sydney), Nam Mỹ (São Paulo). Khách hàng có thể kích hoạt tính năng này thông qua Bảng điều khiển AWS, AWS CLI hoặc AWS SDK.

Để bắt đầu, giờ đây bạn có thể cung cấp kết nối mạng Glue dưới dạng cấu hình bổ sung cùng với các thiết lập tối ưu hóa như thời gian lưu giữ mặc định và số ngày lưu giữ các tệp không có tham chiếu. Danh mục dữ liệu AWS Glue sẽ sử dụng thông tin VPC trong kết nối Glue để truy cập vùng lưu trữ Amazon S3 và tối ưu hóa bảng Apache Iceberg.
Để tìm hiểu thêm, hãy đọc blog và truy cập tài liệu về Danh mục dữ liệu AWS Glue.