AWS Glue Data Catalog 现在支持通过 Amazon VPC 进行 Apache Iceberg 自动表优化
AWS Glue Data Catalog 现在支持自动优化只能从特定 Amazon Virtual Private Cloud (VPC) 环境访问的 Apache Iceberg 表。您可以通过提供 VPC 配置来启用自动优化,以优化存储和提高查询性能,同时保持表的安全性。
AWS Glue Data Catalog 支持压缩、快照保留和未引用文件管理,可帮助您降低元数据开销、控制存储成本和提高查询性能。如果客户的管理和安全配置要求 Amazon S3 存储桶驻留在特定 VPC 中,那么您现在就可以将其与 Glue Catalog 一起使用。这为您提供了更广泛的功能来自动管理 Apache Iceberg 数据,无论数据存储在 Amazon S3 上的哪个位置。
通过 Amazon VPC 进行 Iceberg 表自动优化的功能已在 13 个 AWS 区域推出:美国东部(弗吉尼亚州北部、俄亥俄州)、美国西部(俄勒冈州)、欧洲(爱尔兰、伦敦、法兰克福、斯德哥尔摩)、亚太地区(东京、首尔、孟买、新加坡、悉尼)、南美洲(圣保罗)。客户可以通过 AWS 管理控制台、AWS CLI 或 AWS SDK 启用此功能。
要开始使用,您现在可以提供作为附加配置的 Glue 网络连接以及优化设置(如默认保留期和保留未引用文件的天数)。AWS Glue Data Catalog 将使用 Glue 连接中的 VPC 信息来访问 Amazon S3 存储桶和优化 Apache Iceberg 表。
要了解更多信息,请阅读此博客,并访问 AWS Glue Data Catalog 文档。