Amazon Athena 是一种交互式查询服务,让您能够轻松使用标准 SQL 直接分析 Amazon S3 中的数据。只需在 AWS 管理控制台中单击几下,客户即可使用 Athena 定位其在 S3 中存储的数据,然后使用标准 SQL 执行即席查询并在数秒内获取结果。Athena 属于无服务器服务,因此没有需要设置或管理的基础设施,客户只需为其执行的查询付费。您可以使用 Athena 处理日志、执行即席分析以及交互式查询。Athena 可自动扩展 (执行并行查询),因此可快速获取结果,即使大型数据集和复杂查询也不例外。 

100x100_benefit_cloud

Amazon Athena 属于无服务器服务,因此没有需要管理的基础设施。您无需担心配置、软件更新及故障等问题,也无需担心随着数据集和用户量的增长而扩展基础设施的问题。Athena 会自动处理上述问题以便您专注于数据而非基础设施。 

100x100_benefit_easy-setup

要开始使用,请登录 Athena 控制台、使用控制台向导或输入 DDL 语句来定义您的架构,然后立即使用内置查询编辑器进行查询。您还可以使用 AWS Glue 自动抓取数据源来发现数据,并使用新的和修改过的表与分区定义填充数据目录。结果会在数秒内显示在控制台中,并会自动写入您在 S3 中选择的位置。您可以将结果下载到您的桌面上。使用 Athena,无需执行复杂的 ETL 作业来为数据分析做准备。这使得每个拥有 SQL 技术的人员均可以快速分析大规模数据集。

100x100_benefit_check

Amazon Athena 使用的是 Presto,一种针对低延迟的临时数据分析进行了优化的分布式开源 SQL 查询引擎。这意味着您可以使用 ANSI SQL 针对 Amazon S3 中的大型数据集执行查询,并可全面支持大型连接、开窗函数和数组。Athena 支持多种数据格式,如 CSV、JSON、ORC、Avro 或 Parquet。您还可以使用 Athena 的 JDBC 驱动程序通过多个 BI 工具连接 Athena。

100x100_benefit_pay-as-you-go

使用 Amazon Athena,您只需为执行的查询付费。您需要按每个查询所扫描的数据量付费。通过对数据进行压缩、分区或将其转换为分列格式,您可以节省大量资金并能改善性能,因为其中每项操作均可以减少 Athena 执行查询所需扫描的数据量。

100x100_benefit_performance

使用 Amazon Athena,您不必担心管理或调整集群即可显著提升性能。Athena 通过 Amazon S3 进行了优化,显著提升了性能。Athena 会自动执行并行查询,因此,您可以在数秒内获取查询结果,即使大型数据集不例外。

100x100_benefit_available

Amazon Athena 高度可用并可使用多个设备中的计算资源执行查询,从而在特定设备不可用时能够自动路由适当的查询。Athena 使用 Amazon S3 作为基础数据存储,可确保您的数据具有高可用性和高持久性。Amazon S3 提供耐久的基础设施存储重要数据,其设计旨在为对象提供 99.999999999% 的耐久性。您的数据将跨多个设施和在各个设施的多个设备间冗余存储。

100x100_benefit_secure

Amazon Athena 让您能够通过 AWS Identity and Access Management (IAM) 策略、访问控制列表 (ACL) 和 Amazon S3 存储桶策略控制对数据的访问权限。通过 IAM 策略,您可以授予 IAM 用户对 S3 存储桶的精细控制权限。通过控制对 S3 中数据的访问,您可以限制用户使用 Athena 对其进行查询。借助 Athena,您还能够轻松查询存储在 Amazon S3 中的加密数据,还可将加密结果写回 S3 存储桶。Athena 同时支持服务器端加密和客户端加密。

100x100_benefit_ingergration

Amazon Athena 可与 AWS Glue 进行开箱即用集成。借助 Glue 数据目录,您将能够跨各种服务创建统一的元数据存储库、抓取数据源以发现数据并使用新的和修改过的表与分区定义填充数据目录,以及维护架构版本控制。您还可以使用 Glue 完全托管的 ETL 功能来转换数据或将其转化为列格式,以优化查询性能并降低成本。了解有关 AWS Glue 的更多信息。