发布于: Oct 11, 2018
Amazon Athena 是一种交互式查询服务,让您能够轻松使用标准 SQL 分析 Amazon S3 中的数据。Athena 没有服务器,因此您无需管理任何基础设施,且只需为您运行的查询付费。今天,我们发布了对使用 Select 查询结果创建表这一功能的支持或对 Create Table As Select (CTAS) 语句的支持。分析人员可以使用 CTAS 语句从数据子集或列子集的现有表创建新表,还可选择将数据转换为列格式(如 Apache Parquet 和 Apache ORC)并对其进行分区。Athena 会自动将所生成的表和分区添加到 Glue 数据目录中,从而使它们可以立即用于后续查询。默认情况下,Athena 中的 CTAS 语句以 Parquet 格式写入数据。其他支持的格式包括 Apache ORC、AVRO、JSON 和 Text,并且您还可以选择使用 Gzip 或 Snappy 作为压缩格式。此外,您也可以按列存储数据或选择加密数据。
CTAS 语句允许用户对从较大表构建而成的较小表运行查询,从而有助于降低成本并提高性能。例如,您可以使用 CTAS 语句创建一个表,使其从两个具有 JSON 格式数据的不同表中选择特定列,然后将结果转换为列格式(如 Parquet),并在一个语句中将该表添加到 Glue 数据目录中,从而使后续查询更轻松、更快且更便宜。通过 CTAS 语句,分析人员不再需要依靠数据工程团队来创建可满足特定工作负载需求的表,从而打造一个自助服务环境。要查看更多 CTAS 语句示例,请单击此处。 与 Athena 对 Select 查询的收费方式类似,我们根据在 Select 阶段扫描的字节数计算 CTAS 语句的费用。