发布于: Nov 13, 2020

Amazon Athena 中的联合查询允许用户跨关系、非关系、对象和自定义数据源运行 SQL 查询。通过现已在 us-east-1、us-west-2 和 us-east-2 r区域全面推出的功能,客户可以提交单 SQL 查询从本地运行或云中托管的多个源扫描数据。 

对分布在应用程序的数据进行分析可能很复杂且耗时。分析所需的数据通常分布在关系、键值、文档、内存、搜索、图形、对象、时间序列和分类账数据存储中。为了分析跨这些来源的数据,分析师需要构建复杂的管道,来将这些数据提取、转换和加载到仓库中,以便查询这些数据。访问各种来源中的数据需要学习新的编程语言和数据访问构造。Athena 的联合 SQL 查询允许用户在不移动数据的情况下进行查询,消除了这种复杂性。分析师可以使用熟悉的 SQL 构造跨多个数据源联接数据以进行快速分析,并将结果存储在 Amazon S3 中以备随后使用。 

Athena 使用在 AWS Lambda 上运行的 Athena 数据源连接器执行联合查询。AWS 具有适用于 Amazon DynamoDBApache HBaseAmazon DocumentDBAmazon RedshiftAWS CloudWatchAWS CloudWatch 指标以及与 JDBC 兼容的关系数据库(例如 MySQL 和 Apache 2.0 许可下的 PostgreSQL)的开源数据源连接器。客户可以使用这些连接器在 Athena 中跨这些数据源运行联合 SQL 查询。此外,使用 Athena Query Federation SDK,开发人员可以建立与任何数据源的连接器,以使 Athena 可以针对该数据源运行 SQL 查询。Athena Query Federation 连接器使得 AWS 提供的连接器之外的连接器也能够享受联合查询的优势。由于连接器在 AWS Lambda 上运行,因此客户不必管理基础设施或计划扩展以应对尖峰需求。

在此版本中,Athena 联合查询已向 us-east-1、us-west-2 和 us-east-2 区域全面推出。 

如需了解更多关于此功能的信息,请参阅此处的文档。
要开始使用现有的连接器,请遵循该指南
要了解如何使用 Athena Query Federation SDK 构建自己的数据源,请访问此链接