Amazon Athena for Apache Spark

在不到一秒内在 Apache Spark 上运行交互式分析

为什么选择 Athena on Apache Spark?

使用 Amazon Athena for Apache Spark 在不到一秒内开始交互式分析,以便分析数 PB 数据。通过我们经过优化的 Spark 运行时,交互式 Spark 应用程序立即启动并更快速地运行,以便您可以将更多时间花在获取洞察而不是等待结果上。只需简单的笔记本经验,即可在 Athena 控制台或通过 Athena API 使用 Python 的表现力构建 Spark 应用程序。使用 Athena 无服务器、完全托管式模型,无需管理、预置和配置任何资源,并且没有最低费用或设置成本。您只需为自己运行的查询付费。

优势

将更多时间花在获取洞察而不是等待结果上。通过我们经过优化的 Spark 运行时,交互式 Spark 应用程序可以在不到一秒内启动并更快速地运行。
将 Python 的表现力与流行的开源 Spark 框架结合使用,从数据中寻找更复杂的洞察。使用笔记本查询数据,关联计算和可视化结果。
更经济高效地运行 Spark 应用程序,而无需预置和管理任何资源。构建 Spark 应用程序,而无需担心 Spark 配置或版本升级。
通过业务应用程序,以开放数据格式处理不同数据湖中的数据,无需移动数据。使用 AWS Glue 发掘和分类的数据构建 Spark 洞察。

使用案例

使用 Athena 和 AWS Glue 探索数据集和处理数据。 

查看不同数据集和数据格式,以生成洞察。

构建 SaaS 应用程序,以使用 Athena for Apache Spark 交互式处理数据。

探索数据存储,以生成示例数据集和交互式功能。