使用 AWS Glue 需支付網路爬取程式 (探索資料) 和 ETL 任務 (處理和載入資料) 的費用,以每小時費率按秒計費。對於 AWS Glue Data Catalog,您只需支付存放和存取中繼資料的月費。存放的前一百萬個物件免費,前一百萬次存取也免費。如果要以互動方式開發 ETL 程式碼而佈建一個開發端點,則您的費用是以每小時費率按秒計費。對於 AWS Glue DataBrew,互動式工作階段按工作階段計費,而 DataBrew 任務按分鐘計費。 使用 AWS Glue 結構描述登錄檔無須額外費用。
注意:定價會視區域而異。
-
ETL 任務和開發端點
-
Data Catalog 儲存與請求
-
網路爬取程式
-
DataBrew 互動式工作階段
-
DataBrew 任務
-
彈性檢視
-
ETL 任務和開發端點
-
定價範例
ETL 任務:考慮一個執行 15 分鐘並使用 6 個 DPU 的 AWS Glue Apache Spark 任務。1 個 DPU 小時的價格是 0.44 USD。由於您的任務執行了 1/4 小時並使用了 6 個 DPU,AWS 將向您收取 6 個 DPU * 1/4 小時 * 0.44 USD,即 0.66 USD。
AWS Glue Studio Job Notebooks 和互動式工作階段:假設您使用 AWS Glue Studio 中的一個筆記本以互動方式開發 ETL 程式碼。依預設,一個互動式工作階段具有 5 個 DPU。如果工作階段持續執行 24 分鐘 (2/5 小時),我們將依照每 DPU 小時 0.44 USD 的費率,向您收取 5 個 DPU * 2/5 小時 (0.88 USD) 的費用。
ML 轉換:與 AWS Glue 任務執行類似,在資料上執行 ML 轉換 (包括 FindMatches) 的費用依資料大小、資料內容及使用的節點數目和類型而異。在下列的範例中,我們使用 FindMatches 整合多個資料來源的興趣點資訊。若資料大小為約 11,000,000 列 (1.6GB),在 16 個 G.2x 類型的執行個體上執行約 8,000 列 (641kb) 的標籤資料大小 (確實比對相符或比對不相符的範例) 時,將會產生 34 分鐘的標籤集產生執行階段、費用為 8.23 USD,指標預計執行階段為 11 分鐘、費用為 2.66 USD,FindingMatches 任務執行階段為 32 分鐘、費用 7.75 USD。
-
Data Catalog 儲存與請求
-
定價範例
AWS Glue Data Catalog 免費方案:假設您在某個月於 AWS Glue Data Catalog 存放一百萬個表格,而請求存取這些表格一百萬次。因為用量未超出 AWS Glue Data Catalog 免費方案的範圍,所以需要支付的費用是 0 USD。每月所存放的前一百萬個物件和前一百萬次請求是免費的。
AWS Glue Data Catalog:現在假設您的儲存用量仍是每月一百萬個表格,但請求倍增至每月兩百萬次。假設您另外使用網路爬取程式尋找新表格,其執行時間為 30 分鐘,使用 2 個 DPU。
您的儲存費用仍是 0 USD,因為前一百萬個表格的儲存免費。前一百萬次請求也是免費的。您必須支付超出免費方案的一百萬次請求的費用,金額為 1 USD。網路爬取程式是以每 DPU 小時 0.44 USD 的費率計費,因此,我們將依照每 DPU 小時 0.44 USD 的費率,向您收取 2 個 DPU * 1/2 小時 (0.44 USD) 的費用。每月帳單總金額為 1.44 USD。
-
網路爬取程式
-
-
DataBrew 互動式工作階段
-
定價範例
AWS Glue DataBrew:每 30 分鐘互動式工作階段的價格為 1.00 USD。如果您在上午 9 點開始工作階段,立即離開主控台,然後在上午 9 點 20 分到 9 點 30 分返回,這將使用 1 個工作階段,總計 1.00 USD。
如果您在上午 9 點開始工作階段並在上午 9 點 50 分之前與 DataBrew 主控台互動,退出 DataBrew 專案空間,然後在上午 10 點 15 分返回進行最後的互動,這將使用 3 個工作階段,每個工作階段 1.00 USD,總計 3.00 USD。
-
DataBrew 任務
-
定價範例
AWS Glue DataBrew:如果一個 AWS Glue DataBrew 任務執行 10 分鐘並使用 5 個 AWS Glue DataBrew 節點,則價格為 0.40 USD。任務執行時間為 1/6 小時,使用 5 個節點,因此,我們將依照每節點小時 0.48 USD 的費率,向您收取 5 個節點 * 1/6 小時 * 每節點小時 0.48 USD,總計為 0.40 USD。
-
彈性檢視
-
範例 1:您建立一個檢視,從 Amazon DynamoDB 資料表複製資料並在 Amazon OpenSearch Service 網域中具體化。您的應用程式每小時寫入 0.5 GB 到 DynamoDB 資料表,平均每天 8 小時。由於該檢視將資料從單一來源複製到受管 AWS 資料庫和分析服務 (從 DynamoDB 到 Amazon OpenSearch Service) 中的單一目標,因此該檢視取用約每小時 1 VPU 來處理 1 GB 資料。該月平均使用的資料表儲存為 100 GB。
AWS Glue Elastic Views 每月費用:
檢視處理 – 每小時 0.5 GB × 每小時 1 VPU/GB × 8 小時/天 × 30 天 × 0.16 USD/每小時 VPU = 19.20 USD
資料表儲存 – 100 GB × 0.023 USD/每月每 GB = 2.30 USD
總計 – 19.20 USD + 2.30 USD = 21.50 USD範例 2:您建立一個檢視,從 DynamoDB 資料表複製資料並在 Amazon S3 中具體化。您的應用程式每小時寫入約 2 GB 到 DynamoDB 資料表,平均每天 12 小時。因為該檢視將資料從 DynamoDB 中的單一資料表 (即受管 AWS 資料庫服務) 複製到 Amazon S3 中的單一儲存貯體 (既非受管資料庫也非分析服務),所以其取用約每小時 1.3 VPU 來處理 1 GB 資料。該月平均使用的資料表儲存為 150 GB。
AWS Glue Elastic Views 每月費用:
檢視處理 – 每小時 2 GB × 每小時 1.3 VPU/GB × 12 小時/天 × 30 天 × 0.16 USD/每小時 VPU = 149.76 USD
資料表儲存 – 150 GB × 0.023 USD/每月每 GB = 3.45 USD
總計 – 149.76 USD + 3.45 USD = 153.21 USD
注意:定價會視區域而異。
請檢視全球區域表以進一步了解 AWS Glue 可用性