发布于: Nov 30, 2022

Amazon Athena 现支持 Apache Spark,这是一个常用的开源分布式处理系统,它针对任何规模的数据的快速分析工作负载进行了优化。Athena 是一个交互式查询服务,它帮助您查询 PB 级数据,无论数据位于何处,比如数据湖、数据库或其他数据存储中。使用 Amazon Athena for Apache Spark,除了 SQL 之外,您还可以通过 Spark 获得 Athena 的精简、交互式、无服务器体验。

您可以在 Athena 控制台中使用简单的笔记本经验或通过 Athena API 构建交互式 Apache PySpark 应用程序。借助 Athena,交互式 Spark 应用程序可以立即启动并通过我们优化的 Spark 运行时更快速地运行,以便您可以将更多时间花在获取见解而不是等待结果上。由于 Athena 负责管理基础设施和配置 Spark 设置,您可以专注于业务应用程序。

您可以在以下 5 个 AWS 区域使用 Athena for Apache Spark:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(东京)和欧洲地区(爱尔兰),未来数月还将在更多区域推出。

如需了解更多信息并开始使用该服务,请访问 Amazon Athena for Apache Spark 网页