发布于: Sep 14, 2020
AWS Glue 数据目录现在支持在表格上应用 PartitionIndex。当您不断向表中添加分区时,分区的数量会随着时间的推移而显著增加,从而导致查询时间增加。通过 PartitionIndex,您可以减少整体数据传输次数和处理流程,并缩短查询处理时间。
通过指定给定表中已存在的分区密钥的有序列表,可以在表格创建时创建 PartitionIndex。AWS Glue 数据目录将基于这些密钥创建快速且可搜索的索引。
提供 AWS Glue 的所有区域均提供 PartitionIndex。
要了解更多信息,请参阅 AWS Glue 开发人员指南。