发布于: Jun 26, 2020

Amazon Athena 增加了对分区投影的支持。分区投影是一项新功能,可用于加快高度分区表的查询处理并自动执行分区管理。

处理查询时,Athena 会在执行分区修剪之前从您的元数据存储(例如 AWS Glue 数据目录或 Hive 元存储)中检索元数据信息。如果表具有大量分区,检索元数据可能会很耗时。为避免这种情况,可以使用分区投影。分区投影允许您指定配置信息,例如,常用于形成分区的模式(例如 YYYY/MM/DD)。这为 Athena 提供了构建分区所需的信息,而无需从您的元数据存储中检索元数据信息。Athena 将从配置中,而不是 AWS Glue 数据目录之类的存储库中读取分区值和位置。分区投影减少了针对高度分区表的查询的运行时间,因为内存中操作的速度通常比远程操作更快。

请参阅我们的文档以获取详细信息和用法示例。