概觀

利用 Amazon Redshift,您可以從每小時僅需 0.25 USD 的小規模開始,擴充規模到 PB 級資料和數千個並行使用者。選擇最適合您業務需求的項目,並具備在不過度佈建運算的情況下讓儲存成長的能力,還有在不增加儲存成本的情況下擴展運算容量的靈活性。

可預期的項目
首先,進一步了解有關節點類型的資訊,選擇最適合您需求的叢集組態。您只需使用一個 API 呼叫或在 Redshift 主控台按幾下,輕鬆擴展、暫停和恢復叢集或在節點類型之間切換。您會在選擇之前看到隨需定價,之後可以選擇購買預留節點以取得大幅折扣。

做出選擇後,您可能希望使用彈性大小調整,來在幾分鐘之內輕鬆調整佈建的運算容量,以實現穩定狀態處理。使用大小調整排程器,您可以每天或每週新增和刪除節點,以最佳化成本並獲得最佳效能。對於動態工作負載,您可以使用並行擴展自動佈建額外的運算容量,並且在用完免費積分後,只需為使用部分付費 (按秒計費,請參閱並行擴展定價)。

Amazon Redshift 節點類型

Amazon Redshift 提供了不同的節點類型,可滿足您的工作負載需要,我們建議根據所需的效能、資料大小及增長情況選擇 RA3 或 DC2。 
 
RA3 節點搭配受管儲存,可讓您透過分別擴展運算和受管儲存並分別付費,來最佳化資料倉儲。使用 RA3 時,您可以根據效能需求來選擇節點數目,並只需為您使用的受管儲存付費。您應該根據每日處理的資料量確定 RA3 叢集的大小。
 
Redshift 受管儲存在每個 RA3 節點中使用大型、高效能的固態硬碟 (SSD) 以取得快速的本機儲存,也針對長期的耐用儲存使用 Amazon Simple Storage Service (Amazon S3)。如果節點中的資料成長到超過大型本機 SSD 的大小,Redshift 受管儲存會自動將資料卸載到 Amazon S3。無論資料是在高效能 SSD 或 Amazon S3 中,您都只需為 Redshift 受管儲存支付相同的低費率。針對儲存不斷增加的工作負載,受管儲存讓您能自動擴展資料倉儲容量,而不需要新增額外的節點和為其付費。 
 
DC2 節點允許建立包含本機 SSD 儲存的運算密集型資料倉儲。可以根據資料大小和效能需求來選擇所需的節點數目。DC2 節點將資料存放在本地以提高效能,並且隨著資料大小的增長,您可以新增更多運算節點來增加叢集的儲存容量。對於未經壓縮的 1 TB 以下資料集,我們建議使用 DC2 節點,以便以最低的價格獲得最佳效能。如果您預期資料會增長,我們建議使用 RA3 節點,這樣您就可以獨立調整運算和儲存的大小,以實現最佳的價格效能比。 
 
DS2 節點讓您可以使用硬碟 (HDD) 建立大型資料倉儲,我們建議改為使用 RA3 節點。如果您使用的是 DS2 節點,請參閱《叢集管理指南》中的 RA3 節點類型概觀以獲取升級指導方針。使用 8 個或更多 DS2.xlarge 節點或任意數目的 DS2.8xlarge 節點的客戶,現在可以升級到 RA3,以相同的隨需成本獲得 2 倍的儲存容量和更好的效能。

Redshift 功能搭配依用量計費的定價

  • Amazon Redshift 節點類型:選擇最適合您的叢集組態和節點類型,並且可以使用 Amazon Redshift 隨需定價按小時為容量付費。當您選擇隨需定價時,您可以使用暫停與恢復功能在未使用叢集時暫停隨需計費。您還可以為穩定狀態的工作負載選擇預留執行個體而不是隨需執行個體,並獲得比隨需定價更大的折扣。
  • Amazon Redshift Spectrum 定價:直接對 Amazon S3 資料湖中的 EB 級資料執行 SQL 查詢,只需為掃描的位元組數支付費用。
  • 並行擴展定價:每個叢集每天最多可獲得一小時的免費並行擴展積分,對 97% 的客戶來說已足夠使用。即使有數千個並行的查詢和使用者,這讓您仍能穩定提供快速的查詢效能。用量超過免費積分後,只需按照每秒隨需費率付費即可。
  • Redshift 受管儲存定價:只需為 RA3 叢集中存放的資料支付費用,而與所佈建的運算節點數目無關。您只需根據受管儲存中的資料總量支付小時費用。
  • Redshift ML:使用 SQL 建立、訓練和部署機器學習 (ML) 模型。用完 Amazon SageMaker 的免費方案後,會產生建立模型和儲存空間費用。

AWS 免費方案

作為 AWS 免費方案的一部分,如果組織從未建立過 Redshift 叢集,就符合免費試用 DC2 大型節點兩個月的資格。每個月組織可獲得 750 小時的免費試用時間,這些時數足以讓您持續執行一個配備 160 GB 壓縮 SSD 儲存體的 DC2 大型節點。一旦兩個月免費試用期到期或每個月的用量超過 750 個小時,您可以關閉叢集以免被收取任何費用,或者按照我們的標準隨需費率付費以繼續執行叢集。

隨需定價

Amazon Redshift 隨需定價允許您按小時為容量付費,無需簽訂合約,也無須預付費用。只需根據叢集中的節點類型和數量按小時費率付費。建立、刪除、暫停或繼續叢集等可計費狀態變更之後,不滿一小時以每秒遞增的方式計費。暫停和繼續功能可讓您在叢集暫停期間暫停隨需帳單。叢集暫停期間只需支付備份儲存的費用。這樣就不必在需求出現之前預先規劃和購買資料倉儲容量,並讓您能在開發或測試時,以經濟實惠的方式管理環境。

最新一代

*受管儲存中每個 RA3 節點的可尋址儲存容量。

上一代

計算每年每 TB 的有效隨需價格

對於隨需執行個體,每年每 TB 的有效價格為執行個體小時價格乘以一年內的小時數,再除以每個執行個體的 TB 數。對於 RA3,存放在受管儲存中的資料是根據存放在 RA3 節點類型中的實際資料單獨計費,每年每 TB 的有效價格只會針對運算節點成本來計算。

Amazon Redshift Spectrum 定價

Amazon Redshift Spectrum 讓您能夠直接對 Amazon S3 中 EB 級的資料執行 SQL 查詢。依 Redshift Spectrum 掃描的位元組數計費,未滿 1 MB 以 1 MB 計費,每個查詢最少 10 MB。針對管理分割使用資料定義語言 (DDL) 陳述式 (如 CREATE/ALTER/DROP TABLE) 和失敗的查詢都無須付費。

以壓縮、分割和單欄資料格式存放資料,可提高查詢效能和減少成本。如果您使用 Redshift Spectrum 其中一個支援的格式壓縮資料,因為要掃描的資料較少,所以可降低成本。同樣地,如果以單欄格式存放資料 (如 Apache Parquet 或最佳化列式儲存 (ORC)),因為 Redshift Spectrum 只會掃描查詢所需的欄,所以費用也會下降。

其他費用

您要支付用來搭配 Redshift Spectrum 查詢資料的 Amazon Redshift 叢集費用。Redshift Spectrum 會直接在 Amazon S3 中查詢資料。針對在 S3 儲存貯體中存放的物件以及針對 S3 儲存貯體發出的請求,您要支付標準 S3 費用。如需詳細資訊,請參閱 Amazon S3 費率。 

如果您使用 AWS Glue 資料型錄搭配 Amazon Redshift Spectrum,則依標準 AWS Glue 資料型錄費率計費。如需詳細資訊,請參閱 AWS Glue 定價

當您使用 Amazon Redshift Spectrum 查詢 Amazon S3 中的 AWS Key Management Service (KMS) 加密資料時,則依標準 AWS KMS 費率計費。如需詳細資訊,請參閱 AWS KMS 定價

Redshift Spectrum 定價範例使用美國東部 (維吉尼亞北部) 價格

假設一個有 100 個大小相同欄的表格,以未壓縮的文字檔格式存放在 Amazon S3 且總大小為 4 TB。若要執行查詢以取得表格單一欄的資料,Redshift Spectrum 需要掃描整個檔案,因為文字格式無法分割。此查詢會掃描 4 TB 的資料,需花費 20 USD。(5 USD/TB * 4 TB = 20 USD)

如果使用 GZIP 壓縮檔案,則會看到 4:1 的壓縮比率。在這個情況下,您會有一個大小為 1 TB 的壓縮檔案。Redshift Spectrum 必須掃描整個檔案,但因為大小只有四分之一,所以您只需支付四分之一的費用,也就是 5 USD。(5 USD/TB * 1 TB = 5 USD)

如果您壓縮檔案後轉換為 Apache Parquet 這類單欄格式,將可看到 4:1 的壓縮比率,而且會有一個大小為 1 TB 的壓縮檔案。使用上述相同的查詢,Redshift Spectrum 只需掃描 Parquet 檔案的其中一欄。這個查詢的費用為 0.05 USD。(5 USD/TB * 1 TB 檔案大小 * 1/100 欄,或總共掃描 10 GB = 0.05 USD)。

備註:上述定價範例僅用於說明目的。不同檔案和欄的壓縮比可能有所差異。

並行擴展定價

Redshift 會自動新增暫時性容量,即使有數千個並行的使用者和查詢,仍可持續提供快速查詢效能。不需要管理資源、也無須預付費用,而且會扣掉暫時性叢集在啟動或關機期間的費用。在您的主要叢集執行時,每 24 小時可以累積一小時的並行擴展叢集積分。對於超過免費積分的並行擴展叢集,會按照每秒隨需費率收費。只會計入您查詢所用的用量,每次啟用並行擴展叢集時,最低收費以一分鐘計算。每秒隨需費率則以 Redshift 叢集中的節點類型和節點數量為準。

並行擴展積分

Redshift 叢集每天最多可獲得一小時的免費並行擴展積分。AWS 帳戶的每個啟用中叢集會每小時獲得積分,獲得積分後,只能由同一個叢集使用。每個啟用中的叢集最高均可累積 30 小時的免費並行擴展積分。只要未中止叢集,積分就不會過期。

並行擴展定價範例

美國東部的 10 DC2.8XL 節點的 Redshift 叢集每小時要價 48 USD。假設有兩個暫時性叢集的使用時間超出免費並行擴展積分可用時間 5 分鐘。並行擴展的每秒隨需費率為 48 USD * 1/3600 = 每秒 0.013 USD。在這個案例中,並行擴展的額外費用為每秒 0.013 USD * 300 秒 * 2 個暫時性叢集 = 8 USD。因此,在這個案例中,Amazon Redshift 叢集加上兩個暫時性叢集的總成本為 56 USD。

Amazon Redshift 受管儲存定價

您要根據您區域適用的固定 GB-月費率,為受管儲存中存放的資料支付費用。受管儲存只提供 RA3 節點類型,無論資料大小,都需針對 Redshift 受管儲存支付同樣的低費率。受管儲存的用量是根據受管儲存中呈現的總資料量按小時計算 (請參閱底下的範例,將 GB-小時的用量轉換成 GB-月的費用)。您可以透過 Amazon CloudWatch 或 AWS 管理主控台來監控 RA3 叢集中的資料量。在 RA3 節點與受管儲存之間任何數據傳輸費不用支付任何費用。受管儲存費用不包含因為自動和手動快照而產生的備份儲存費用 (請參閱備份儲存)。一旦叢集終止,您仍需為繼續保留手動備份付費。

受管儲存定價的定價範例

假設您在四月的前 15 天使用 RA3 節點類型在受管儲存中存放 100 GB 的資料,而在四月的後 15 天存放 100 TB 的資料。
我們先計算上述案例中的 GB-小時用量。針對前 15 天,您的 GB-小時用量為: 100 GB x 15 天 x ( 24 小時/天) = 36,000 GB-小時。
針對後 15 天,您的 GB-小時用量為: 100 TB X 1024 GB/TB X 15 天 X ( 24 小時/天) = 36,864,000 GB-小時

在四月結束時,GB-小時全部用量的總和為:36,000 GB-小時 + 36,864,000 GB-小時 = 36,900,000 GB-小時
我們將這個數字轉換成 GB-月:36,900,000 GB-小時/每月 720 小時 (四月) = 51,250 GB-月。

如果此資料是存放在美國東部 (維吉尼亞北部) 區域,受管儲存將按照 0.024 USD/GB-月來收費。51,250 GB-月的每月儲存費用為:51,250 GB-月 x 每 GB-月 0.024 USD = 1,230 USD
四月的受管儲存總費用為 = 1,230 USD

Redshift ML 定價

使用 Amazon Redshift ML 時,預測函數會在 Redshift 叢集中執行,不會產生額外費用。但 CREATE MODEL 請求會使用 Amazon SageMaker 訓練模型,並使用 Amazon S3 儲存,且產生額外費用。費用根據訓練資料的儲存格數量而定,儲存格數量是記錄數量 (訓練查詢或表格中) 乘於欄數的承數。舉例來說,如果 CREATE MODEL 的 SELECT 查詢產生 10,000 筆訓練記錄,且每筆記錄有五欄,則訓練資料的儲存格數量為 50,000 個。

Amazon SageMaker 費用
如果先前不曾使用過 Amazon SageMaker,開始使用 Redshift ML 即可使用 Amazon SageMaker 免費方案。這包括兩個月每月兩個免費 CREATE MODEL 請求,每個請求最多 100,000 個儲存格。免費方案從您在 Redshift ML 建立第一個模型的第一個月開始計算。

Amazon S3 費用
CREATE MODEL 請求也會產生小額 Amazon S3 費用。S3 成本應少於每月 1 USD,因 CREATE MODEL 產生的 S3 資料數量僅約幾 GB。當廢棄項目收集啟動時,它們會被快速刪除。系統會先使用 Amazon S3 存放 CREATE MODEL 的 SELECT 查詢所產生的訓練資料。接著,系統會將其用來存放多種預測所需的模型相關成品。預設廢棄項目收集模式會在 CREATE MODEL 結束時,刪除訓練資料和模型相關成品。成本控制選項。

您可以設定 MAX_CELLS 來控制訓練成本。如果未設定,MAX_CELLS 的預設值會是一百萬個,且絕大部分情況訓練成本會維持 20 USD 以下。訓練資料組大於一百萬個時,定價會增加,如下所示:

成本控制選項
您可以設定 MAX_CELLS 來控制訓練成本。如果未設定,MAX_CELLS 的預設值會是一百萬個,且絕大部分情況訓練成本會維持 20 USD 以下。訓練資料組大於一百萬個時,定價會增加,如下所示:

儲存格數量 價格

前 1,000 萬個儲存格

每一百萬個儲存格 20 USD

後續 9,000 萬個儲存格

每一百萬個儲存格 15 USD

超過 1 億個儲存格

每一百萬個儲存格 7 USD

 

請注意,實際定價通常會低於上述上限。 

CREATE MODEL 成本範例:

  • 100,000 萬個儲存格為 20 USD (= 1 x 20)
  • 2,000,000 萬個儲存格為 40 USD (= 2 x 20)
  • 23,000,000 萬個儲存格為 395 USD (= 10 x 20 + 13 x 15)
  • 99,000,000 萬個儲存格為 1,535 USD (= 10 x 20 + 89 x 15) 以及 
  • 211,000,000 萬個儲存格為 2,327 USD (= 10 x 20 + 90 x 15 + 111 x 7)

如果 CREATE MODEL 的 SELECT 查詢所產生的訓練資料超過您提供的 MAX_CELLS 上限 (若您未提供則為預設的一百萬),CREATE MODEL 會從訓練資料集中選擇約為 MAX_CELLS/「欄數」的記錄,並使用這些隨機選擇的元組訓練。(隨機選擇是設計來確保減少的訓練資料集不會有偏差。) 因此,設定 MAX_CELLS 可讓您的成本不超支。

預留執行個體定價

預留執行個體適合穩定狀態的生產工作負載,且提供較隨需定價更多的折扣。客戶通常會在執行實驗和概念驗證確定生產配置之後購買預留執行個體。

透過簽訂使用 Amazon Redshift 1 年或 3 年期的合約,與隨需費率相比可以節省大筆費用。預留執行個體定價僅適用於購買的節點類型,在保留期間結束之前都會保持有效。價格包括資料的兩個額外副本 – 一個在叢集節點,另一個在 Amazon S3 中。我們將為您處理備份、耐久性、可用性、安全性、監控和維護工作。

預留執行個體定價有三個選項:

不預付 – 無須任何預付款,只需承諾每月支付費用,為期一年。

部分預付 – 您需要預付部分預留執行個體費用,其餘費用分為一或三年期支付。

全部預付 – 您將以一次預付款支付整個預留執行個體的費用 (一或三年期)。

預留執行個體是一種計費概念,並不會用來建立資料倉儲叢集。當您購買時,即使目前並未執行叢集,或者現有的叢集已暫停,也需要支付相關的預付款和每月費用。若要購買預留執行個體,請瀏覽我們主控台中的 Reserved Nodes (預留節點) 標籤。

我們可以隨時終止預留執行個體的定價計劃。除了須遵循預留執行個體定價之外,預留執行個體還須支付以下費用:依據 AWS 客戶協議或與我們達成的規範服務使用的其他協議,適用的所有資料傳輸和其他費用。

* 以下每月費率是以實際小時費率乘以每月平均小時數來計算。

** 以下實際小時費率是執行個體在整個合約期間的每小時攤餘成本,包括任何預付款。

最新一代

上一代

計算每年每 TB 的有效預留執行個體價格

對於預留執行個體,則是預付款加上小時費率乘以合約期間的小時數,再除以合約期間的年數和每個節點的 TB 數。對於 RA3,存放在受管儲存中的資料是根據存放在 RA3 節點類型中的實際資料單獨計費,每年每 TB 的有效價格只會針對運算節點成本來計算。

最新一代

上一代

備份儲存

備份儲存是與拍攝資料倉儲快照相關的儲存。延長備份保留期或增加快照拍攝數量,將增加資料倉儲所消耗的備份儲存。Redshift 會依您使用主控台、應用程式介面 (API)或命令列界面 (CLI) 手動拍攝的快照收費。使用 Redshift 快照排程功能建立的 Redshift 自動快照則無需付費。RA3 叢集上存放的資料屬於 Redshift Managed Storage (RMS) 的一部分且以 RMS 費率計費,但為 RA3 叢集手動建立的快照則依本頁面所述,按備份儲存以標準 Amazon S3 費率計費。

例如,如果您的 RA3 叢集擁有 10 TB 的資料和 30 TB 的手動快照,則會針對 10 TB 的 RMS 和 30 TB 的備份儲存計費。對於密集化運算 (DC) 和密集化儲存 (DS) 叢集,儲存包含在叢集中且不會另外計費,但備份是儲存在外部的 Amazon S3 中。超過 DC 和 DS 叢集上的佈建儲存大小的備份儲存將按備份儲存以標準 S3 費率計費。快照到期或刪除之前都會計費,包括叢集暫停或刪除時。

資料傳輸

在相同 AWS 區域內的 Amazon Redshift 和 Amazon S3 之間備份、還原、載入和卸載操作的資料傳輸不需付費。傳入和傳出 Amazon Redshift 的所有其他資料傳輸,則需按照標準 AWS 資料傳輸費計算。 尤其是,如果在 Amazon Virtual Private Cloud (VPC) 中執行 Amazon Redshift 叢集,將會以標準 AWS 數據傳輸費對透過 JDBC/ODBC 傳輸到 Amazon Redshift 叢集端點的資料進行收費。此外,當您使用增強型 VPC 路由將資料卸載到不同區域中的 Amazon S3,會產生標準 AWS 數據傳輸費。如需 AWS 資料傳輸費的詳細資訊,請參閱 Amazon Elastic Cloud Compute (Amazon EC2) 定價頁面

定價範例

Redshift 受管儲存範例

您使用了四個 ra3.xlarge 節點和 40 TB 的 Redshift 受管儲存一個月。在一個月內,您還可使用 Redshift Spectrum 掃描 20 TB 資料並掃描 20 TB 的資料。您使用了隨需定價。

您的費用計算方式如下:

  • Redshift RA3 執行個體成本 = 4 個執行個體 x 每小時 3.26 USD x 一個月 730 小時 = 9,519.20 USD
  • Redshift 受管儲存成本 = 40 TB x 每 TB 1,024 GB x 0.024 USD = 983.04 USD
  • Redshift Spectrum 成本 = 20 TB x 5.00 USD = 100.00 USD

每月總成本:$10,602.24 USD

Redshift 並行擴展範例

美國東部的 10 DC2.8XL 節點的 Redshift 叢集每小時成本為 48 USD。假設有兩個暫時性叢集的使用時間超出免費並行擴展積分可用時間 5 分鐘。並行擴展的每秒隨需費率為 48 USD * 1/3600 = 每秒 0.013 USD。在這個案例中,並行擴展的額外成本為每秒 0.013 USD * 300 秒 * 2 個暫時性叢集 = 8 USD。因此,Redshift 叢集加上兩個暫時性叢集的總成本為 56 USD。

Redshift Spectrum 範例

假設一個有 100 個大小相同欄的表格,以未壓縮的文字檔格式存放在 Amazon S3 且總大小為 4 TB。若要執行查詢以取得表格單一欄的資料,Redshift Spectrum 需要掃描整個檔案,因為文字格式無法分割。根據美國東部 (弗吉尼亞北部) 的 Redshift Spectrum 定價,此查詢會掃描 4 TB 的資料,須花費 20 美元。(5.00 USD/TB * 4 TB = 20 USD) 

如果使用 GZIP 壓縮檔案,則會看到 4:1 的壓縮比率。在這個情況下,您會有一個大小為 1 TB 的壓縮檔案。Redshift Spectrum 必須掃描整個檔案,但因為大小只有四分之一,所以您只需支付四分之一的費用,也就是 5 USD。(5 USD/TB * 1 TB = 5 USD) 

如果您壓縮檔案後轉換為 Apache Parquet 這類單欄格式,將可看到 4:1 的壓縮比率,而且會有一個大小為 1 TB 的壓縮檔案。使用上述相同的查詢,Redshift Spectrum 只需掃描 Parquet 檔案的其中一欄。這個查詢的成本為 0.05 USD。(5 USD/TB * 1 TB 檔案大小 * 1/100 欄,或總共掃描 10 GB = 0.05 USD)。 

備註:上述定價範例僅用於說明目的。不同檔案和欄的壓縮比可能有所差異。

其他定價資源

AWS 定價計算器

輕鬆計算您的 AWS 每月成本

成本資源中心

切換到 AWS 的其他資源

探索更多 Amazon Redshift 資源

瀏覽資源頁面
準備好開始建立?
Amazon Redshift 入門
還有其他問題嗎?
聯絡我們