問:什麼是資料倉儲?
分析的運用範圍很廣。我們都使用報告和儀表板來管理工作、向股東們報告進度,以及執行臨機操作分析來支援決策。如果深入探究,這些報告、儀表板和 BI 工具都由資料倉儲在幕後支援,這些資料倉儲會有效率地存放資料以大幅降低 I/O,並飛快地將查詢結果同時交付給成千上萬個使用者。資料倉儲與交易資料庫不同,它使用特殊化架構和儲存,獲得快速的查詢和資料載入效能。此外,資料倉儲必須可高度擴展,這樣才能隨時加入更多資料來源,以獲得更豐富的分析和洞見。最後一點,資料倉儲應該與第三方商業智慧工具和 SQL 用戶端無縫整合,並支援標準 SQL,使客戶能夠使用早已熟悉的技能。
問:為什麼要在 AWS 上執行資料倉儲?
我們提供的 Amazon Redshift,是一種快速、易於使用且全受管的解決方案。它可自動化基礎設施的佈建和管理任務,像是備份、複寫、修補。它與第三方的 BI 和 ETL 工具緊密整合,因此您可在幾分鐘內取得第一份報告。同時,載入和分析的資料量沒有限制。隨著資料不斷增加,您無須擔心昂貴的系統升級或是效能變慢。Amazon Redshift 可快速處理任何規模的資料量,因為它使用單欄式儲存以及多種優化技術。Amazon Redshift 也很經濟實惠,您只需按實際用量付費。最關鍵的是,每年您只需要支付每 TB 1000 USD 的價格,就可讓無限的使用者在所有資料上執行無限次的分析。
問:什麼是 Amazon Redshift?
Amazon Redshift 是快速、全受管的 PB 級資料倉儲,可讓您使用現有的商業智慧工具,以簡單且經濟實惠的方式分析所有資料。無須簽訂長期合約,您可從每小時僅需 0.25 USD 的小規模開始,再擴展到每年每 TB 1,000 USD 的 PB 級規模,此成本只要傳統解決方案的十分之一以下。客戶通常會看到 3 倍的壓縮,這可將他們每年每個未壓縮 TB 的成本降到 333 USD。
問:相較於最傳統的資料倉儲及分析用資料庫,Amazon Redshift 的效能如何?
Amazon Redshift 使用了各種創新技術,相較於傳統的資料倉儲及分析工作負載資料庫,最高可提升十倍的效能:
- 大規模平行:Amazon Redshift 可在資料集上提供 GB 到 EB 規模的快速查詢效能。Redshift 使用單欄式儲存、資料壓縮及區域映射,以降低執行查詢所需的 I/O 數量。它使用大規模平行處理 (MPP) 資料倉儲架構來平行化和分散 SQL 操作,以充分利用所有可用的資源。基礎硬體為高效能資料處理而設計,使用本機連接儲存空間以最大化 CPU 與磁碟機之間的輸送量,同時使用高頻寬網格網路以最大化節點之間的輸送量。
- 機器學習:無論您的工作負載或並行用量為何,Amazon Redshift 都能使用機器學習提供高輸送量。Redshift 利用複雜的演算法來預測傳入的查詢執行時間,並將它們分配到最佳佇列以進行最快的處理。例如,某些查詢,例如儀表板和具有高平行要求的報表,會被安排途經某個快速佇列以便立即處理。隨著並行的增加,Amazon Redshift 可預測佇列可能開始的時間,然後使用並行擴展功能自動部署暫時資源,確保無論叢集的需求如何變化都能有一致的快速效能。
- 結果快取:Amazon Redshift 使用結果快取,為重複的查詢提供不到一秒的回應時間。儀表板、視覺化和商業智慧工具,在執行重複的查詢時,會體驗到效能得到大幅的提升。執行查詢時,Redshift 會搜尋快取,看看是否存在先前執行過而經過快取的結果。如果找到經過快取的結果,而且資料並未改變,則會立即傳回快取結果,而非重新執行查詢。
問:如何存取正在執行的資料倉儲叢集?
一旦您的資料倉儲叢集可供使用,您就可以從 AWS 管理主控台或用 Redshift API 擷取它的端點以及 JDBC 和 ODBC 連線字串。然後,您可以用偏好的資料庫工具、程式設計語言或商業智慧 (BI) 工具來使用此連線字串。您將需要將網路請求授權給正在執行的資料倉儲叢集。有關詳細說明,請參閱我們的入門指南。
問:Amazon Redshift 與我偏好的商業智慧軟體套件及 ETL 工具相容嗎?
Amazon Redshift 使用產業標準 SQL,並可使用標準 JDBC 和 ODBC 驅動程式存取。您可以從主控台的連線用戶端標籤下載 Amazon Redshift 自訂 JDBC 和 ODBC 驅動程式。我們與熱門的 BI 和 ETL 供應商進行的整合已經獲得驗證,其中許多都提供免費試用,以協助您開始載入和分析資料。您也可以前往 AWS Marketplace,只需幾分鐘,就可以部署和設定專為與 Amazon Redshift 搭配使用而設計的解決方案。
問:如何開始使用 Amazon Redshift?
您可以免費試用 Amazon Redshift。如果您從未建立過 Amazon Redshift 叢集,就符合免費試用 DC1.Large 節點 2 個月的資格。每個月您可獲得 750 小時的免費試用時間,這些時數足以讓您持續執行一個配備 160 GB 壓縮 SSD 儲存體的 DC1.Large 節點。您也可以建置具有多個節點的叢集,以測試更大型的資料集,不過這樣會很快用完您的免費時數。一旦兩個月免費試用期到期或每個月的用量超過 750 個小時,您可以關閉叢集以免被收取任何費用,或者按照我們的標準隨需費率付費以繼續執行叢集。