使用 Amazon Athena,您只需支付所執行查詢的費用。我們按每個查詢掃描的資料量向您收費。透過壓縮、分割或將資料轉換成單欄格式,可大幅節省成本和提高效能,因為這些操作都可降低 Athena 執行查詢時所需掃描的資料量。

Amazon Athena 現在已正式上市

開始使用 Amazon Athena
  • 掃描的資料每 TB 為 5 USD。 

將資料壓縮、分割並轉換為單欄格式,則每個查詢的成本可節省 30% 到 90%,且可獲得較高的效能。

依 Amazon Athena 掃描的位元組數計費,四捨五入到最近的 MB 數,每個查詢最少 10 MB。針對管理分割使用資料定義語言 (DDL) 陳述式 (如 CREATE/ALTER/DROP TABLE) 和失敗的查詢都無須付費。取消的查詢會按掃描的資料量計費。

壓縮資料可讓 Athena 掃描較少的資料。將資料轉換成單欄格式後,Athena 可以選擇僅讀取處理資料所需的直欄,Athena 支援 Apache ORC 和 Apache Parquet。資料分割後,Athena 也可以限制掃描的資料量,如此一來便可節省成本和改善效能。您可以在 Athena 主控台上看到每個查詢所掃描的資料量。有關詳細資訊,請查看 Athena 定價範例

Amazon Athena 可從 Amazon S3 直接查詢資料。使用 Athena 查詢資料不需另付儲存費用。您只需針對儲存、請求和資料傳輸支付標準 S3 費率。根據預設,查詢結果會存放在您選擇的 S3 儲存貯體中,而且依標準 Amazon S3 費率計費。

如果您使用 AWS Glue 資料型錄搭配 Athena,則會依標準 AWS Glue 資料型錄費率計費。如需詳細資訊,按一下這裡

假設有一個表格包含 3 個相同大小的欄,以未壓縮文字檔的形式存放在 Amazon S3 上,大小總計為 3 TB。若要執行查詢以取得表格單一欄的資料,Amazon Athena 需要掃描整個檔案,因為文字格式無法分割。

  • 這個查詢的費用是 15 USD。(掃描 3 TB 的價格是 3 * 5 USD/TB = 15 USD)

如果使用 GZIP 壓縮檔案,則會看到 3:1 的壓縮比率。在這個情況下,您會有一個大小為 1 TB 的壓縮檔案。在這個檔案上執行相同查詢的費用是 5 USD。Athena 必須再重新掃描整個檔案,但是由於它的大小是原來的三分之一,因此您只需要支付之前費用的三分之一。

如果您不只壓縮檔案還將檔案轉換成單欄格式 (如 Apache Parquet) 以獲得 3:1 的壓縮比率,則 Amazon S3 上仍然是 1 TB 大小的資料。然而,在這個情況中,由於 Parquet 是單欄式,因此 Amazon Athena 只需讀取與所執行查詢相關的欄。由於進行的查詢只會參考單一欄,因此 Athena 只會讀取該欄,並避開讀取檔案中三分之二的部分。由於 Athena 只讀取三分之一的檔案,因此只會從 S3 掃描 0.33 TB 的資料。

  • 這個查詢的費用是 1.67 USD。由於壓縮的關係節省了三倍的成本,再加上只讀取一欄,因此又節省了三倍的成本。
    (檔案大小 = 3 TB/3 = 1 TB。讀取單一欄時掃描的資料 = 1 TB/3 = 0.33 TB。0.33 TB 的價格 = 0.33 * 5 USD/TB = 1.67 USD)