開始使用專案

7 個步驟  |  60 分鐘

問:什麼是資料倉儲?

分析的運用範圍很廣。我們都使用報告和儀表板來管理工作、向股東們報告進度,以及執行臨機操作分析來支援決策。如果深入探究,這些報告、儀表板和 BI 工具都由資料倉儲在幕後支援,這些資料倉儲會有效率地存放資料以大幅降低 I/O,並飛快地將查詢結果同時交付給成千上萬個使用者。資料倉儲與交易資料庫不同,它使用特殊化架構和儲存,獲得快速的查詢和資料載入效能。此外,資料倉儲必須可高度擴展,這樣才能隨時加入更多資料來源,以獲得更豐富的分析和洞見。最後一點,資料倉儲應該與第三方商業智慧工具和 SQL 用戶端無縫整合,並支援標準 SQL,使客戶能夠使用早已熟悉的技能。

問:為什麼要在 AWS 上執行資料倉儲?

我們提供的 Amazon Redshift,是一種快速、易於使用且全受管的解決方案。它可自動化基礎設施的佈建和管理任務,像是備份、複寫、修補。它與第三方的 BI 和 ETL 工具緊密整合,因此您可在幾分鐘內取得第一份報告。同時,載入和分析的資料量沒有限制。隨著資料不斷增加,您無須擔心昂貴的系統升級或是效能變慢。Amazon Redshift 可快速處理任何規模的資料量,因為它使用單欄式儲存以及多種優化技術。Amazon Redshift 也很經濟實惠,您只需按實際用量付費。最關鍵的是,每年您只需要支付每 TB 1000 USD 的價格,就可讓無限的使用者在所有資料上執行無限次的分析。 

問:什麼是 Amazon Redshift?

Amazon Redshift 是快速、全受管的 PB 級資料倉儲服務,可讓您使用現有的商業智慧工具,以簡單且經濟實惠的方式分析所有資料。無須簽訂長期合約,您可從每小時僅需 0.25 USD 的小規模開始,再擴展到每年每 TB 1,000 USD 的 PB 級規模,此成本只要傳統解決方案的十分之一以下。客戶通常會看到 3 倍的壓縮,這可將他們每年每個未壓縮 TB 的成本降到 333 USD。

問:相較於最傳統的資料倉儲及分析用資料庫,Amazon Redshift 的效能如何?

Amazon Redshift 使用了各種創新技術,相較於傳統的資料倉儲及分析工作負載資料庫,最高可提升十倍的效能:

  • 單欄式資料儲存體:Amazon Redshift 以欄組織資料,而不是以一連串的列儲存資料。以列為基礎的系統適用於交易處理,而以欄為基礎的系統則適用於資料倉儲及分析,在這種系統的查詢經常涉及大型資料集的彙總執行。因為只會處理涉及查詢的欄,而且單欄式資料是依序存放在儲存媒體上,因此以欄為基礎的系統所需的 I/O 非常少,可大幅提高查詢效能。
  • 進階壓縮:因為單欄式資料存放區會將類似的資料依序存放在磁碟上,所以與以列為基礎的資料儲存相比可進行更大程度的壓縮。Amazon Redshift 採用多種壓縮技術,而且通常比傳統的關聯式資料存放區更能進行大幅度的壓縮。此外,Amazon Redshift 不需要索引或具體化檢視,因此,使用的空間也少於傳統的關聯式資料庫系統。將資料載入空的表格時,Amazon Redshift 會自動採樣您的資料,並選擇最適合的壓縮機制。
  • 大規模平行處理 (MPP):Amazon Redshift 會自動在所有節點分配資料及查詢負載。Amazon Redshift 可讓您輕鬆將節點新增到資料倉儲,而且隨著您的資料倉儲規模擴大,仍能維持快速的查詢效能。

問:如何存取正在執行的資料倉儲叢集?

一旦您的資料倉儲叢集可供使用,您就可以從 AWS 管理主控台或用 Redshift API 擷取它的終端節點以及 JDBC 和 ODBC 連線字串。然後,您可以用偏好的資料庫工具、程式設計語言或商業智慧 (BI) 工具來使用此連線字串。您將需要將網路請求授權給正在執行的資料倉儲叢集。有關詳細說明,請參閱我們的入門指南

問:Amazon Redshift 與我偏好的商業智慧軟體套件及 ETL 工具相容嗎?

Amazon Redshift 使用產業標準 SQL,並可使用標準 JDBC 和 ODBC 驅動程式存取。您可以從主控台的連線用戶端標籤下載 Amazon Redshift 自訂 JDBC 和 ODBC 驅動程式。我們與熱門的 BI 和 ETL 供應商進行的整合已經獲得驗證,其中許多都提供免費試用,以協助您開始載入和分析資料。您也可以前往 AWS Marketplace,只需幾分鐘,就可以部署和設定專門為與 Amazon Redshift 搭配使用而設計的解決方案。

問:如何開始使用 Amazon Redshift?

您可以免費試用 Amazon Redshift。如果您從未建立過 Amazon Redshift 叢集,就符合免費試用 DC1.Large 節點 2 個月的資格。每個月您可獲得 750 小時的免費試用時間,這些時數足以讓您持續執行一個配備 160 GB 壓縮 SSD 儲存體的 DC1.Large 節點。您也可以建置具有多個節點的叢集,以測試更大型的資料集,不過這樣會很快用完您的免費時數。一旦兩個月免費試用期到期或每個月的用量超過 750 個小時,您可以關閉叢集以免被收取任何費用,或者按照我們的標準隨需費率付費以繼續執行叢集。

開始使用專案