宣布推出 Amazon S3 Tables – 针对分析工作负载进行了优化的完全托管式 Apache Iceberg 表
发布于:
2024年12月3日
Amazon S3 Tables 提供了首款内置 Apache Iceberg 支持的云对象存储,也是大规模存储表格数据的最简单方法。S3 Tables 专门针对分析工作负载进行了优化,与自主管理的表相比,查询吞吐量提高多达 3 倍,每秒事务数提高多达 10 倍。由于 S3 Tables 支持 Apache Iceberg 标准,可以通过常用的 AWS 和第三方查询引擎轻松查询您的表格数据。此外,S3 Tables 旨在进行持续的表维护,即使您的数据湖不断扩展和演变,它也能随着时间的推移自动优化查询效率和存储成本。 S3 Tables 与 AWS Glue Data Catalog 的集成处于预览阶段,允许您使用 Amazon Data Firehose、Athena、Redshift、EMR 和 QuickSight 等 AWS 分析服务流式传输、查询和可视化数据(包括 S3 Metadata 表)。
S3 Tables 引入了表存储桶,这是一种专为存储表格数据而构建的全新存储桶类型。使用表存储桶,您可以快速创建表并设置表级权限来管理对数据湖的访问权限。然后,您可以使用标准 SQL 加载和查询表中的数据,并利用 Apache Iceberg 的高级分析功能,例如行级事务、可查询快照、架构演变等。表存储桶还提供策略驱动的表维护,帮助您自动执行运营任务,例如压缩、快照管理和未引用文件删除。
Amazon S3 Tables 现已在美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)区域推出,并将很快在其他区域推出。 如需了解定价详情,请访问 S3 定价页面。要了解更多信息,请访问产品页面、文档和 AWS 新闻博客。