Amazon Redshift 是最快速且得到最廣泛使用的雲端資料倉儲。Redshift 與您的資料湖整合,提供比其他任何資料倉儲均高 3 倍的價格效能。

特色與優點

我們每年參考客戶使用案例和意見回饋之後發布了數百種功能和產品改進。 查看更多最新消息。

與您的資料湖和 AWS 服務進行最深度的整合

Amazon Redshift 可讓您以快速簡單的方式使用各種開放格式資料,同時可輕鬆整合并連接 AWS 生態系統。

從您的資料湖進行查詢並匯入和匯出資料:沒有其他雲端資料倉儲可以用如此簡單的方式查詢資料,並以各種開放格式將資料寫回您的資料湖。您可以查詢 Parquet、ORC、JSON、Avro、CSV 等開放檔案格式,並使用熟悉的 ANSI SQL 在 S3 進行更直接的查詢。要將資料匯出您的資料湖,您只需在 SQL 程式碼使用 Redshift UNLOAD 命令,並將 Parquet 指定為檔案格式,Redshift 就能自動設定資料格式,然後將資料移至 S3。這可讓您靈活地將經常存取的高度結構化資料存放到 Redshift 資料倉儲,並與 S3 中 EB 規模的結構化、半結構化和未結構化資料保持同步。將資料從 Redshift 匯回資料湖可讓您使用 Amazon AthenaAmazon EMRAmazon SageMaker 等 AWS 服務來進一步分析資料。 

聯合查詢:使用 Redshift 中的全新聯合查詢功能,您可以連到操作的關聯式資料庫。查詢一或多個 Amazon RDS 和 Aurora PostgreSQL 資料庫以及預覽版 RDS MySQL 和 Aurora MySQL 資料庫中的即時資料,以立即查看端對端業務營運,而無須移動資料。您可以聯結來自 Redshift 資料倉儲的資料、資料湖中的資料,現在還可聯結操作存放區的資料,以便做出更佳的資料驅動決策。Redshift 提供複雜的優化功能,降低透過網路移動的資料,並使用大規模平行資料處理作為輔助,以進行高效能的查詢。進一步了解

Redshift ML:Redshift ML 讓資料分析師及資料庫開發人員使用 SQL 輕鬆建立、訓練及部署 Amazon SageMaker 模型。藉助 Amazon Redshift ML,客戶可以使用 SQL 語句,根據 Amazon Redshift 中的資料建立和訓練 Amazon SageMaker 模型,然後使用這些模型執行各種預測,例如直接在查詢和報告中進行流失率偵測和風險評分。請瀏覽 Redshift 文件,了解如何開始使用。進一步了解。 

AWS 分析生態系統:與 AWS 分析生態系統的原生整合,可讓您更輕鬆地處理端對端分析工作流程,不會有任何阻礙。 例如,AWS Lake Formation 是能在幾天內輕鬆設定安全資料湖的服務。AWS Glue 可以將資料擷取、轉換和載入 (ETL) 到 Redshift。Amazon Kinesis Data Firehose 則是擷取、轉換串流資料並將其載入 Redshift 以進行近乎即時分析的最簡單方法。您可以使用 Amazon EMR 透過 Hadoop/Spark 處理資料,並將輸出載入 Amazon Redshift 以用於 BI 和分析。Amazon QuickSight 是第一個採用按工作階段付費定價的 BI 服務,可用來建立 Redshift 資料的報告、視覺化和儀表板。您可以使用 Redshift 準備資料,以便透過 Amazon SageMaker 執行機器學習工作負載。為了加快移轉至 Amazon Redshift 的速度,您可以使用 AWS Schema Conversion ToolAWS Database Migration Service (DMS)。Amazon Redshift 同時與 Amazon Key Management Service (KMS)Amazon CloudWatch 深度整合,以實現安全性、監控和合規。也可以使用 Lambda UDF 從 SQL 查詢中叫用 Lambda 函數,如同在 Redshift 中叫用使用者定義函數一樣。可以撰寫 Lambda UDF 以整合 AWS 合作夥伴服務並存取其他熱門的 AWS 服務,例如 Amazon DynamoDB 或 Amazon SageMaker。

Redshift 合作夥伴主控台整合 (預覽版):可以透過以下方式在幾分鐘內加速資料採用並形成極具價值的商業洞見:在 Redshift 主控台中整合精選的合作夥伴解決方案。使用這些解決方案,您可以將來自 Salesforce、Google Analytics、Facebook Ads、Slack、Jira、Splunk 和 Marketo 之類應用程式中的資料高效、簡化地帶入 Amazon Redshift 資料倉儲。這還可讓您加入這些不同的資料集並進行分析,以形成可行的洞見。

最佳效能

Amazon Redshift 提供領先業界的快速效能,而且非常彈性靈活。

RA3 執行個體:RA3 執行個體所提供的價格效能是任何雲端資料倉儲服務的 3 倍。這些 Amazon Redshift 執行個體可針對需要大量運算容量的效能密集型工作負載將速度最大化,並讓您彈性指定所需的執行個體數量,以分開支付運算和儲存的費用。進一步了解

AQUA (Advanced Query Accelerator) for Amazon Redshift:AQUA 是新的分散式與硬體加速快取,可自動提升某些類型查詢的執行速度,從而讓 Redshift 查詢的執行速度比其他企業雲端資料倉儲更上 10 倍。AQUA 使用高速固態儲存、現場可程式化閘道陣列 (FPGA) 和 AWS Nitro 來加速用於掃描、篩選和彙總大型資料集的査詢。AQUA 包含在 Redshift RA3 執行個體類型中,無需額外付費。 進一步了解

有效率的儲存和高效能查詢處理:Amazon Redshift 可針對 GB 到 PB 規模之間任何大小的資料集提供快速查詢效能。單欄式儲存、資料壓縮及區域映射降低了執行查詢所需的 I/O 數量。除了 LZO 和 Zstandard 這類產業標準編碼,Amazon Redshift 還針對數字和日期/時間類型提供專用壓縮編碼 AZ64,可節省儲存和優化查詢效能。

具體化檢視:Amazon Redshift 具體化檢視可大幅加快查詢效能,使儀表板等迭代或可預測的分析工作負載、商業智慧 (BI) 工具查詢,以及擷取、載入、轉換 (ELT) 資料處理任務受惠。您可以使用具體化視圖,輕鬆地儲存和管理同時引用一或多個資料表,包括外部資料表的 SELECT 語句的預先運算結果。參考具體化檢視的後續查詢會重複使用預先運算的結果,大幅加快執行速度。Amazon Redshift 可以用遞增方式有效維護具體化檢視,以持續提供低延遲效能的優勢。進一步了解。 

使用機器學習最大化輸送量和效能:Amazon Redshift 的進階機器學習功能可提供高輸送量和效能,即使處理不同的工作負載或並行使用者活動也沒問題。Amazon Redshift 使用複雜的演算法來根據執行時間和資源需求預測和分類傳入查詢,以動態管理效能和並行,同時也協助您優先處理關鍵業務工作負載。短期查詢加速 (SQA) 可將短期查詢從儀表板等應用程式傳送到快速佇列進行立即處理,無須等待大型查詢結束。自動工作負載管理 (WLM) 使用機器學習來動態管理記憶體和並行,協助最大化查詢輸送量。此外,您現在可以針對最重要的查詢輕鬆設定優先順序,即使已提交數百個查詢也沒關係。Amazon Redshift 也是一個自主學習系統,可持續觀察使用者工作負載、隨著用量提高找出改善效能的機會、無縫套用優化,以及在需要明確使用者動作以進一步大幅提高 Amazon Redshift 效能時,透過 Redshift Advisor 提供建議。 

結果快取:Amazon Redshift 使用結果快取,為重複的查詢提供不到一秒的回應時間。儀表板、視覺化和商業智慧工具,在執行重複的查詢時,會體驗到效能得到大幅的提升。執行查詢時,Amazon Redshift 會搜尋快取,看看是否存在先前執行過而經過快取的結果。如果找到經過快取的結果,而且資料並未改變,則會立即傳回快取結果,而非重新執行查詢。

可擴展性最高

無論您擴展的是資料或使用者,Amazon Redshift 幾乎沒有限制。 

PB 規模的資料倉儲:Amazon Redshift 非常簡單,可以根據您的需求變化進行快速擴展。只需在主控台中按幾下滑鼠或透過簡單的 API 呼叫,就可以輕鬆變更資料倉儲中的節點數量或類型,並根據需求的變化進行擴展或縮小。使用受管儲存,其可自動新增容量以支援高達 8 PB 壓縮資料的工作負載。 進一步了解管理您的叢集。

PB 規模的資料湖分析:您可以對 Amazon S3 中的 PB 級資料執行查詢,無須使用 Redshift Spectrum 功能載入或轉換任何資料。您可以將 S3 當作高度可用、安全且經濟實惠的資料湖,以開放資料格式存放不限數量的資料。無論查詢的複雜程度或資料量如何,Amazon Redshift Spectrum 都能在數千個平行節點上執行查詢,以提供快速結果。 

無限並行性:Amazon Redshift 即使有數千個並行查詢也能提供一致的快速效能,無論在 Amazon Redshift 資料倉儲查詢資料或直接在 Amazon S3 資料湖查詢皆可。Amazon Redshift 並行擴展可支援幾乎無限個並行使用者和並行查詢,並在並行數量增加時,於幾秒內新增暫時的容量,以提供一致的服務水準。 

資料共享:Amazon Redshift 資料共享在多個 Redshift 叢集中共享即時資料,從而提供了一種安全、便捷的擴展方式。透過對任何 Redshift 叢集中的資料進行即時、精細和高效能的存取,同時無需複製或移動資料,資料共享有效提升了組織的敏捷性。進一步了解

最佳價格

使用 Amazon Redshift 作為您的雲端資料倉儲,可彈性地分開支付運算和儲存費用,能夠暫停與恢復叢集,透過各項控制來預測成本,以及可選擇按用量付費或透過預留執行個體承諾節省高達 75% 的成本。

彈性的定價選項:Amazon Redshift 是最經濟實惠的資料倉儲,您可以選擇資料倉儲的最佳付費方式。您可以在沒有承諾的情況下,從每小時 0.25 USD 的小規模開始,之後擴展每年每 TB 只要 1000 USD。Amazon Redshift 是唯一提供隨需定價、且無須預付費用的雲端資料倉儲,您可以簽訂 1 或 3 年期的預留執行個體定價,如此便可節省高達 75% 的費用,而且每個查詢定價是根據您在 Amazon S3 資料湖中掃描的資料量而定。Amazon Redshift 定價包含內建安全、資料壓縮、備份儲存和資料傳輸。隨著資料大小成長,您可以使用 RA3 執行個體中的受管儲存以符合經濟效益的方式存放資料,每月每 GB 只要 0.024 USD。

即使是不可預測的工作負載也可預測成本:因為 Amazon Redshift 的每個叢集每天最多可賺取一小時的免費並行擴展積分,讓客戶在擴展時能大幅降低對成本的影響。這些免費積分足以滿足 97% 客戶的並行需要。這可讓您預測每個月的成本,即使在分析需求起伏不定的期間也可進行預測。 

選擇節點類型以取得最佳的工作負載價格:針對資料倉儲需求,您可以從三種執行個體類型中選擇,以優化 Amazon Redshift。

RA3 節點可讓您獨立擴展儲存,無須顧慮運算。使用 RA3,您可以獲得將資料存放在獨立儲存層的高效能資料倉儲。您只要根據需要的查詢效能來調整資料倉儲大小即可。

密集化運算 (DC) 節點可讓您使用快速 CPU、大量的 RAM 及固態硬碟 (SSD) 來建立效能非常高的資料倉儲,對少於 500 GB 的資料是最佳選擇。

若您購買 3 年期預留執行個體,DS2 (密集化儲存) 節點可讓您以低價使用硬碟 (HDD) 建立大型資料倉儲。在 DS2 叢集執行業務的大多數客戶,都可將工作負載移轉到 RA3 叢集,以與 DS2 相同的價格,享有高達 2 倍的效能和更多儲存空間。

只需發出單一 API 呼叫或在 AWS 主控台中按幾下,即可擴展叢集或切換不同節點類型。 如需詳細資訊,請瀏覽定價頁面。

易於管理

Amazon Redshift 可自動化常見的維護任務,讓您專注在資料洞見而非資料倉儲。

自動佈建:Amazon Redshift 的設定及操作十分容易。您只需在 AWS 主控台中按幾下滑鼠,即可部署新的資料倉儲,Amazon Redshift 會自動為您佈建基礎架構。大部分管理任務都可自動執行,例如備份和複寫。當您需要控制時,有多種選項可供您選擇,協助您根據具體的工作負載進行調整。新功能會以透明公開的方式發佈,無須安排和套用升級和修補程式。

自動備份:Amazon Redshift 中的資料會自動備份到 Amazon S3,而 Amazon Redshift 能將您的快照以非同步方式複寫到另一個區域的 S3,以用於災難復原。您可透過 AWS 管理主控台或 Redshift API,用任何系統快照或使用者快照恢復您的叢集。系統中繼資料一旦恢復,您的叢集就可供使用,而且可在使用者資料於背景多工緩衝處理時開始執行查詢。

自動化表格設計:Amazon Redshift 持續監控使用者工作負載,同時使用複雜的演算法來探尋改善資料實體佈局以優化查詢速度的方法。自動表格優化會選擇最合適的排序和分佈索引鍵,以優化叢集工作負載的效能。如果 Amazon Redshift 確定運用索引鍵會提高叢集效能,則表格將自動得到更改,而無需管理員的介入。自動 Vacuum 刪除、自動表格排序和自動分析等其他功能可避免對 Redshift 叢集進行手動維護和調整,從而為新叢集和生產工作負載取得最佳效能。 

容錯能力:有多種可增強資料倉儲叢集可靠性的功能。例如,Amazon Redshift 會持續監控叢集的運作狀態,並自動從故障的磁碟機重新複寫資料,還會在必要時替換節點,以提供容錯能力。也可以將叢集重新放置到替代的可用區域 (AZ),而不會丟失任何資料或變更應用程式。

靈活查詢:Amazon Redshift 提供執行查詢的彈性,您可在主控台中執行查詢,或是連接您喜愛的 SQL 用戶端工具、程式庫或商業智慧工具。AWS 主控台查詢編輯器提供了強大的界面,可在 Amazon Redshift 叢集執行 SQL 查詢,還有在查詢旁檢視查詢結果和查詢執行計劃 (針對運算節點上執行的查詢)。

與 Amazon Redshift 互動的簡單 API: Amazon Redshift 可讓您使用所有類型的傳統、雲端原生、容器化、無伺服器 Web 服務式應用程式和事件驅動式應用程式,輕鬆存取資料。Amazon Redshift Data API 可簡化資料存取、擷取以及從 AWS SDK 支援的程式設計語言和平台輸出,例如 Python、Go、Java、Node.js、PHP、Ruby 和 C++。資料 API 可讓您無需設定驅動程式和管理資料庫連線。現在只需叫用資料 API 提供的安全 API 端點,即可對 Amazon Redshift 叢集執行 SQL 命令。資料 API 會負責管理資料庫連線和緩衝資料。資料 API 具有非同步性,因此可以稍後擷取結果。您的查詢結果會儲存長達 24 小時。

原生支援進階分析:Redshift 支援標準純量資料類型,例如 NUMBER、VARCHAR 和 DATETIME,同時為以下進階分析處理提供原生支援:

空間資料處理:Amazon Redshift 提供一種 GEOMETRY 多態資料類型,該類型支援多種幾何形狀,如 Point、Linestring、Polygon 等。Redshift 還提供空間 SQL 函數來建構幾何形狀,以及匯入、匯出、存取和處理空間資料。您可以將 GEOMETRY 欄新增至 Redshift 表格,並跨越空間和非空間資料寫入 SQL 查詢。此功能可讓您儲存、擷取和處理空間資料,並讓您透過將空間資料整合到分析查詢來無縫增強商業洞見。使用 Redshift 的無縫查詢資料湖的功能,您也可以將外部表格整合至空間查詢,輕鬆地將空間處理延伸到資料湖。如需詳細資訊,請參閱相關文件。

HyperLogLog 草圖:HyperLogLog 是一種新型的演算法,可以有效估計資料集中不同值的近似數量。HLL 草圖是一種建構,用於封裝有關資料集中不同值的資訊。對於在大型資料集上運算近似基數且平均相對錯誤在 0.01–0.6% 之間的查詢,可使用 HLL 實現顯著的效能優勢。Redshift 提供了一流的資料類型 HLLSKETCH 和關聯的 SQL 函數,以產生、保留和結合 HyperLogLog 草圖。Amazon Redshift 的 HyperLogLog 功能使用偏差更正技術,同時以少量記憶體提供高準確度。如需詳細資訊,請參閱相關文件。

DATE 與 TIME 資料類型:Amazon Redshift 提供了 DATE、TIME、TIMETZ、TIMESTAMP 和 TIMESTAMPTZ 等多種資料類型來原生儲存和處理資料/時間資料。TIME 和 TIMESTAMP 類型儲存不帶時區資訊的時間資料,而 TIMETZ 和 TIMESTAMPTZ 類型儲存包含時區資訊的時間資料。可以使用各種日期/時間 SQL 函數來處理 Redshift 查詢中的日期和時間值。如需詳細資訊,請參閱相關文件。

半結構化資料處理:Amazon Redshift SUPER 資料類型將 JSON 和其他半結構化資料原生儲存在 Redshift 表格中,同時使用 PartiQL 查詢語言無縫處理半結構化資料。SUPER 資料類型本質上是無結構的,可儲存可能包含 Redshift 純量值、巢狀陣列和巢狀結構的巢狀值。PartiQL 是 SQL 的擴展,其提供強大的查詢功能,例如物件和陣列導覽、陣列的展開、動態輸入和無結構語意。這就能夠實現將傳統的結構化 SQL 資料與半結構化的 SUPER 資料相結合的進階分析,同時提供卓越的效能、靈活性和易用性。如需詳細資訊,請參閱相關文件。

與第三方工具整合:有許多選項可增強 Amazon Redshift,可透過業界最先進的工具和與專家合作載入、轉換和視覺化資料。我們擁有數量龐大的合作夥伴清單,這些合作夥伴都已通過認證其解決方案可搭配 Amazon Redshift 使用。

最安全且合規

AWS 擁有完整的安全功能,可滿足要求最高的規定,而 Amazon Redshift 提供了現成的資料安全,無須額外付費。

端對端加密:只要設定幾個參數,即可將 Amazon Redshift 設定為利用 SSL 來保護傳輸中的資料,並利用硬體加速型 AES-256 加密來保護靜態資料。如果您選擇啟用靜態資料的加密,則所有寫入硬碟的資料以及任何備份資料也將被加密。根據預設,Amazon Redshift 負責金鑰的管理。

網路隔離:Amazon Redshift 讓您能設定防火牆規則,以控制對資料倉儲叢集的網路存取。您可在 Amazon Virtual Private Cloud (VPC) 中執行 Redshift,在自己的虛擬網路中隔離資料倉儲叢集,並以產業標準加密的 IPsec VPN,將其連接至您現有的 IT 基礎架構。

稽核與合規:Amazon Redshift 與 AWS CloudTrail 整合,可讓您對所有的 Redshift API 呼叫進行稽核。Redshift 會記錄所有 SQL 操作,包括連接嘗試、查詢和資料倉儲變更。您可以使用 SQL 查詢,在系統表格中存取這些記錄,或選擇將記錄儲存到 Amazon S3 上的安全位置。Amazon Redshift 符合 SOC1、SOC2、SOC3 和 PCI DSS 第 1 級法規。如需詳細資訊,請瀏覽 AWS 雲端合規

字符化:藉助 Amazon Lambda 使用者定義函數 (UDF),可以將 AWS Lambda 函數用作 Amazon Redshift 中的 UDF,並從 Redshift SQL 查詢中叫用此函數。此功能可讓您為 SQL 查詢撰寫自訂擴展,以實現與其他服務或第三方產品的緊密整合。可以撰寫 Lambda UDF,以透過與 Protegrity 等供應商整合來啟用外部字符化、資料遮罩、資料識別和去識別,同時可在查詢期間根據使用者的許可和所屬群組保護或取消保護敏感資料。 

精細的存取控制:精細的列和欄層級安全控制可確保使用者只會看到他們應該存取的資料。Amazon Redshift 與 AWS Lake Formation 整合,確保 Lake Formation 的欄層級存取控制也會在 Redshift 查詢資料湖資料時強制套用。

查看更多最新消息

如需更詳細的產品資訊,請參閱 Amazon Redshift 文件

進一步了解 Amazon Redshift 定價

瀏覽定價頁面
準備好開始建立?
Amazon Redshift 入門
還有其他問題嗎?
聯絡我們