張貼日期: Oct 11, 2018
Amazon Athena 是一種互動式查詢服務,可讓您使用標準 SQL 輕鬆分析 Amazon S3 中的資料。Athena 沒有伺服器,所以不需管理基礎設施,而且您只需支付執行的查詢費用。我們現在支援使用 Select 查詢結果建立表格,或 Create Table As Select (CTAS) 陳述式。分析師可使用 CTAS 陳述式從資料子集或欄子集的現有表格建立新的表格,而且還能選擇將資料轉換成單欄格式,例如 Apache Parquet 和 Apache ORC,然後進行分割。Athena 可自動在 Glue 資料型錄新增結果表格和分割區,讓後續的查詢可以立即使用。根據預設,Athena 的 CTAS 陳述式會以 Parquet 格式寫入資料。其他支援格式包含 Apache ORC、AVRO、JSON 和文字,並提供使用 Gzip 或 Snappy 做為壓縮格式的選項。您也可以依欄儲存資料,或選擇加密資料。
CTAS 陳述式可讓使用者在從較大表格建構的較小表格執行查詢,以協助降低成本和提高效能。舉例來說,您可以使用 CTAS 陳述式建立一個表格,從兩個不同的表格選取特定欄,而且資料要是 JSON 格式,將結果轉換成 Parquet 這類單欄格式,然後在單一陳述式將表格新增到 Glue 資料型錄,之後就能以輕鬆、快速和低廉的價格執行後續查詢。使用 CTAS 陳述式,分析師不再需要依賴資料工程團隊建立符合其特定工作負載的表格,以建立自助服務的環境。按一下這裡可取得其他 CTAS 陳述式範例。 CTAS 陳述式依 Select 階段掃描的位元組數量計費,與 Athena 計算 Select 查詢費用的方式相似。