为什么 Amazon Athena 在查询具有多个分区的表时会超时?

上次更新时间:2019 年 7 月 30 日

我的 Amazon Athena 表有很多分区,达数十甚至数十万个。查询表时 Athena 超时了。但是,当表未分区时,查询可正常执行。为什么会出现这种情况,我该怎样解决呢?

简短描述

当您有许多不是字符串类型的分区时会发生这种情况。当您使用字符串类型时,Athena 会在元数据仓级别精简分区。但是,当您使用其他数据类型时,Athena 会在服务器端精简分区。您拥有的分区越多,此过程所需的时间越长,查询超时的可能性就越大。

解决方法

要解决此问题,请将分区类型设置为字符串。当您这样做时,Athena 会在将元数据仓级别精简分区。这可以减少开销并防止查询超时。


这篇文章对您有帮助吗?

我们可以改进什么?


需要更多帮助吗?