发布于: Nov 21, 2022
使用 Amazon S3 Select 时,Amazon S3 将在 Trino 上运行的查询性能提升了高达 9 倍。Trino 是一个开源 SQL 查询引擎,用于对存储在 Amazon S3 中的数据运行交互式分析。使用 S3 Select,您可以“下推”计算工作来筛选 S3 数据,而无需返回整个对象。通过结合使用 Trino 和 S3 Select,您只需从一个对象中检索数据的一个子集,从而能够减少返回的数据量并加快查询性能。
从今天开始,借助 AWS 对开源 Trino 的上游贡献,您可以结合使用 Trino 与 S3 Select,以提高查询性能。S3 Select 将筛选和访问对象内部数据的繁重工作分流到 Amazon S3,这减少了必须由 Trino 传输和处理的数据量。例如,如果您在 Amazon S3 上构建了一个数据湖,并且正在使用 Trino,那么您可以借助 S3 Select 的筛选功能来轻松快速地运行交互式临时查询。
要了解有关结合使用 Trino 和 S3 Select 的更多信息,请访问 S3 技术博客。要了解有关 S3 Select Trino 连接器的更多信息,请访问 Trino GitHub 存储库。有关定价信息,请访问Amazon S3 定价页面。