发布于: Jun 2, 2020

今天,Amazon Athena 发布了一项新功能,可让您将 Athena 连接到您的 Apache Hive Metastore。 

客户将 Hive Metastore 用作其大数据环境的通用元数据目录。此类客户在 Amazon EC2 和 Amazon EMR 集群上运行 Apache Spark、Presto 和 Apache Hive,并将自托管的 Hive Metastore 作为公共目录。AWS 还提供 AWS Glue 数据目录,这是一个完全托管的目录,并且是 Hive Metastore 的简易替代。在当前版本中,除了 Glue 数据目录之外,您现在可以将多个 Hive Metastore 连接到 Athena。 

要连接到自托管的 Hive Metastore,您需要一个 Athena Hive Metastore 连接器。我们已经建立了此连接器的参考实现,并可供您使用。连接器在您的账户中作为 AWS Lambda 函数运行。文档中提供了添加 Hive Metastore 连接器的详细步骤。 

如需了解此功能的更多信息,请访问我们的文档