Amazon Redshift 可透過快速、簡單且安全的大規模雲端資料倉儲加快您獲得洞察的時間。

功能與優點

我們每年參考客戶使用案例和意見回饋之後發布了數百種功能和產品改進。 查看更多最新消息。

人人都能上手的分析

可專心在數秒內從資料獲得洞察,交出業務成果,不必為管理資料倉儲擔憂。

Amazon Redshift Serverless (預覽):Amazon Redshift Serverless (預覽) 是 Amazon Redshift 的無伺服器選項,能在幾秒內輕鬆執行及擴展分析,無需設定和管理資料倉儲基礎設施。使用 Redshift Serverless,任何使用者—包括資料分析師、開發人員、商業專業人員和資料科學家—只需負載並查詢資料倉儲中的資料,便能從資料獲得洞察。進一步了解

查詢編輯器 v2:使用 SQL 可讓 Amazon Redshift 的資料和資料湖更便於資料分析師、資料工程師及其他 SQL 使用者存取,以利用 Web 分析工作台執行資料探索和分析。查詢編輯器 v2 可讓您以單鍵動作將查詢結果視覺化、建立結構和表格、以視覺方式負載資料,及瀏覽資料庫物件。此外也是一種符合直觀的編輯器,可編寫與分享 SQL 查詢、分析、視覺化和註解,還能與團隊安全地共用。

自動化表格設計:Amazon Redshift 能監控使用者工作負載,同時使用複雜的演算法來探尋改善資料實體佈局以優化查詢速度的方法。 自動表格優化會選擇最合適的排序和分佈金鑰,以優化叢集工作負載的效能。如果 Amazon Redshift 確定運用金鑰會提高叢集效能,則表格將自動得到更改,而無需管理員的介入。自動 Vacuum 刪除、自動表格排序和自動分析等其他功能可避免對 Redshift 叢集進行手動維護和調校,從而為新叢集和生產工作負載取得最佳效能。

以本身的工具進行查詢:Amazon Redshift 賦予您靈活性,可在主控台內執行查詢,亦可連接 SQL 用戶端工具、程式庫或資料科學工具,包括 Amazon Quicksight、Tableau、PowerBI、QueryBook 和 Jupyter Notebook。

與 Amazon Redshift 互動的簡單 API:Amazon Redshift 可讓您使用所有類型的傳統、雲端原生、容器化、無伺服器 Web 服務應用程式和事件驅動式應用程式,輕鬆存取資料。Amazon Redshift Data API 可簡化資料存取、擷取以及從 AWS SDK 支援的程式設計語言和平台輸出,例如 Python、Go、Java、Node.js、PHP、Ruby 和 C++。資料 API 可讓您無需設定驅動程式和管理資料庫連線。現在只需叫用資料 API 提供的安全 API 端點,即可對 Amazon Redshift 叢集執行 SQL 命令。資料 API 會負責管理資料庫連線和緩衝資料。資料 API 具有非同步性,因此可以稍後擷取結果。您的查詢結果會存放 24 小時。

容錯能力:有多種可增強資料倉儲叢集可靠性的功能。例如,Amazon Redshift 會持續監控叢集的運作狀態,並自動從故障的磁碟機重新複寫資料,還會在必要時替換節點,以提供容錯能力。也可以將叢集重新放置到替代的可用區域 (AZ),而不會丟失任何資料或變更應用程式。

分析您的所有資料

遍及操作資料庫、資料湖、資料倉儲和數千個第三方資料集,對複雜的擴展資料執行即時與預測性分析,獲得整合式洞察。

聯合查詢:使用 Amazon Redshift 中的全新聯合查詢功能,您可以連到操作的關聯式資料庫。查詢一或多個 Amazon Relational Database Service (RDS) 和 Aurora PostgreSQL 以及 RDS MySQL 和 Aurora MySQL 資料庫中的即時資料,以立即查看完整業務營運,而無須移動資料。您可以聯結來自 Redshift 資料倉儲的資料、資料湖中的資料,還可聯結操作存放區的資料,以便做出更佳的資料驅動型決策。Amazon Redshift 提供複雜的優化功能,降低透過網路移動的資料,並使用大規模平行資料處理作為輔助,以進行高效能的查詢。進一步了解

從您的資料湖進行查詢並匯入和匯出資料:沒有其他雲端資料倉儲可以用如此簡單的方式查詢資料,並以各種開放格式將資料寫回您的資料湖。您可以查詢 Parquet、ORC、JSON、Avro、CSV 等開放檔案格式,並使用熟悉的 ANSI SQL 在 S3 進行更直接的查詢。要將資料匯出至您的資料湖,您只需在 SQL 程式碼使用 Amazon Redshift UNLOAD 命令,並將 Parquet 指定為檔案格式,Amazon Redshift 就能自動設定資料格式,然後將資料移至 S3。這可讓您具靈活性地將經常存取的高度結構化資料和半結構化資料存放到 Amazon Redshift 資料倉儲中,並與 Amazon S3 中 EB 規模的結構化、半結構化和未結構化資料保持同步。將資料從 Amazon Redshift 匯回資料湖可讓您使用例如 Amazon Athena、Amazon EMR 和 Amazon SageMaker 等 AWS 服務來進一步分析資料。

AWS 服務整合:與 AWS 服務、資料庫和機器學習服務進行原生整合,能更夠加輕鬆流暢地處理完整分析工作流程。例如,AWS Lake Formation 是能在幾天內輕鬆設定安全資料湖的服務。AWS Glue 可以將資料擷取、轉換和負載 (ETL) 到 Amazon Redshift。Amazon Kinesis Data Firehose 則是擷取、轉換串流資料並將其負載至 Amazon Redshift 以進行近乎即時分析的最簡單方法。您可以使用 Amazon EMR 透過 Hadoop/Spark 處理資料,並將輸出負載至 Amazon Redshift 以用於 BI 和分析。Amazon QuickSight 是第一個採用按工作階段付費定價的 BI 服務,可用來建立 Redshift 資料的報告、視覺化和儀表板。您可以使用 Amazon Redshift 準備資料,以便透過 Amazon SageMaker 執行機器學習 (ML) 工作負載。為了加快遷移至 Amazon Redshift 的速度,您可以使用 AWS Schema Conversion Tool 和 AWS Database Migration Service (DMS)。Amazon Redshift 也同時與 Amazon Key Management Service (KMS) 和 Amazon CloudWatch 深度整合,以實現安全性、監控和合規。也可以使用 Lambda 使用者定義函數 (UDF) 從 SQL 查詢中叫用 Lambda 函數,如同在 Amazon Redshift 中叫用 UDF 一樣。可以撰寫 Lambda UDF 以與合 AWS 合作夥伴服務整合並存取其他熱門的 AWS 服務,例如 Amazon DynamoDB 和 Amazon SageMaker。

合作夥伴主控台整合:可以透過以下方式在幾分鐘內加速資料採用並形成極具價值的商業洞察:在 Amazon Redshift 主控台中整合精選的合作夥伴解決方案。使用這些解決方案,您可以將來自 Salesforce、Google Analytics、Facebook Ads、Slack、Jira、Splunk 和 Marketo 之類應用程式中的資料高效、簡化地帶入 Redshift 資料倉儲。這還可讓您將這些不同的資料集合併並進行分析,以形成可行的洞察。

資料共享:Amazon Redshift 資料共享允許您將 Amazon Redshift 在單一叢集中提供的易用性、效能和成本優勢擴展至多叢集部署,同時能夠共享資料。資料共享可跨 Redshift 叢集實現即時、精密且快速的資料存取,而無需對其複製或移動。資料共享可即時存取資料,以便資訊在資料倉儲中更新時,您的使用者始終能看到最新且一致的資訊。您可以在相同或不同的 AWS 帳戶中以及跨區域,與 Redshift 叢集安全地共享即時資料。進一步了解

AWS Data Exchange for Amazon Redshift:可從您本身的 Redshift 叢集查詢 Amazon Redshift 資料集,無需進行資料的擷取、轉換和負載 ETL。您可在 AWS Data Exchange 中訂閱 Redshift 雲端資料倉儲產品。提供者一有更新,訂閱者即可檢視變更。若您是資料提供者,訂閱開始時即自動授予存取權,並於結束時撤銷;應付款時能自動產生發票,款項透過 AWS 收取。您可對一般檔案、Amazon Redshift 中的資料,以及透過 API 遞送的資料提供存取授權,全都以單一訂閱完成。進一步了解

Redshift ML:Redshift ML 讓資料分析師、資料科學家、BI 專業人士和開發人員使用 SQL 輕鬆建立、訓練及部署 Amazon SageMaker 模型。藉助 Redshift ML,您可以使用 SQL 語句,根據 Amazon Redshift 中的資料建立和訓練 Amazon SageMaker 模型,然後使用這些模型執行各種預測,例如直接在查詢和報告中進行流失率偵測、財務預測、個人化和風險評分。進一步了解

原生支援進階分析:Amazon Redshift 支援標準純量資料類型,例如 NUMBER、VARCHAR 和 DATETIME,同時為以下進階分析處理提供原生支援:

  • 空間資料處理:Amazon Redshift 提供一種 GEOMETRY 多態資料類型,該類型支援多種幾何形狀,如 Point、Linestring、Polygon。Amazon Redshift 還提供空間 SQL 函數來建構幾何形狀,以及匯入、匯出、存取和處理空間資料。您可以將 GEOMETRY 欄新增至 Redshift 表格,並跨越空間和非空間資料寫入 SQL 查詢。此功能可讓您存放、擷取和處理空間資料,並讓您透過將空間資料整合到分析查詢來無縫增強商業洞察。使用 Amazon Redshift 的無縫查詢資料湖的功能,您也可以將外部表格整合至空間查詢,輕鬆地將空間處理延伸到資料湖。請參閱文件以獲得詳細資訊。
  • HyperLogLog 草圖:HyperLogLog 是一種新型的演算法,可以有效估計資料集中不同值的近似數量。HLL 草圖是一種建構,用於封裝資料集中不同值的資訊。對於在大型資料集上運算近似基數且平均相對錯誤在 0.01–0.6% 之間的查詢,可使用 HLL 草圖實現顯著的效能優勢。Amazon Redshift 提供一流的資料類型 HLLSKETCH 和關聯的 SQL 函數,以產生、保留和結合 HyperLogLog 草圖。Amazon Redshift 的 HyperLogLog 功能使用偏差更正技術,同時以少量記憶體提供高準確度。請參閱文件以獲得詳細資訊。
  • DATE 與 TIME 資料類型:Amazon Redshift 提供 DATE、TIME、TIMETZ、TIMESTAMP 和 TIMESTAMPTZ 等多種資料類型來原生存放和處理資料/時間資料。TIME 和 TIMESTAMP 類型存放不帶時區資訊的時間資料,TIMETZ 和 TIMESTAMPTZ 類型則存放包含時區資訊的時間資料。可以使用各種日期/時間 SQL 函數來處理 Redshift 查詢中的日期和時間值。請參閱文件以獲得詳細資訊。
  • 半結構化資料處理:Amazon Redshift SUPER 資料類型將 JSON 和其他半結構化資料原生存放在 Redshift 表格中,同時使用 PartiQL 查詢語言無縫處理半結構化資料。SUPER 資料類型本質上是無結構的,可儲存可能包含 Redshift 純量值、巢套陣列和巢套結構的巢套值。PartiQL 是 SQL 的擴展,其提供強大的查詢功能,例如物件和陣列導覽、陣列的巢套展開、動態輸入和無結構語意。這就讓您能夠實現將傳統的結構化 SQL 資料與半結構化的 SUPER 資料相結合的進階分析,同時提供卓越的效能、靈活性和易用性。請參閱文件以獲得詳細資訊。
  • 與第三方工具整合:有許多選項可增強 Amazon Redshift,可透過業界最先進的工具和與專家合作負載、轉換和視覺化資料。我們擁有數量龐大的合作夥伴清單,這些合作夥伴都已通過認證,其解決方案可搭配 Amazon Redshift 使用。
    • 透過資料整合合作夥伴負載和轉換資料。
    • 透過商業智慧合作夥伴分析資料並與整個組織分享洞察。
    • 透過系統整合與諮詢合作夥伴架構和實作分析平台。
    • 使用查詢和資料模型建立合作夥伴的工具及公用程式來查詢、探索和建立資料模型。

任何規模的效能

透過自動優化提高查詢速度,相較於其他雲端資料倉儲,效能價格比提升高達 3 倍。

RA3 執行個體:RA3 執行個體所提供的效能價格比任何雲端資料倉儲服務好 3 倍。這些 Amazon Redshift 執行個體可針對需要大量運算容量的效能密集型工作負載將速度最大化,並具有靈活性可讓您指定所需執行個體數量,以分開支付運算和儲存的費用。進一步了解

Advanced Query Accelerator (AQUA) for Amazon Redshift:AQUA 是新的分散式與硬體加速快取,可自動提升某些類型查詢的執行速度,從而讓 Amazon Redshift 查詢的執行速度比其他企業雲端資料倉儲更上 10 倍。AQUA 使用高速固態儲存、現場可程式化閘道陣列 (FPGA) 和 AWS Nitro 來加速用於掃描、篩選和彙總大型資料集的査詢。AQUA 包含在 Redshift RA3 執行個體類型中,無需額外成本。進一步了解

有效率的儲存和高效能查詢處理:Amazon Redshift 可針對 GB 到 PB 規模之間任何大小的資料集提供快速查詢效能。單欄式儲存、資料壓縮及區域映射降低了執行查詢所需的輸入/輸出數量。除了 LZO 和 Zstandard 這類產業標準編碼,Amazon Redshift 還針對數字和日期/時間類型提供專用壓縮編碼 AZ64,可節省儲存和優化查詢效能。

無限並行性:Amazon Redshift 即使有數千個並行查詢也能提供一致的快速效能,無論在 Redshift 資料倉儲查詢資料或直接在 Amazon S3 資料湖查詢皆可。Amazon Redshift 並行擴展可支援幾乎無限個並行使用者和並行查詢,並在並行數量增加時,於幾秒內新增暫時的容量,以提供一致的服務水準。進一步了解

具體化檢視:Amazon Redshift 具體化檢視可大幅加快迭代或可預測的分析工作負載的查詢效能,例如儀表板、商業智慧 (BI) 工具的查詢,以及擷取、載入、轉換和負載 ELT 資料處理任務。您可以使用具體化視圖,輕鬆地存放和管理同時參考一或多個資料表,包括外部資料表的 SELECT 語句的預先運算結果。參考具體化檢視的後續查詢會重複使用預先運算的結果,大幅加快執行速度。Amazon Redshift 可以用增量改進方式有效維護具體化檢視,以持續提供低延遲效能的利益。進一步了解

使用機器學習最大化輸送量和效能:Amazon Redshift 的進階機器學習 (ML) 功能可提供高輸送量和效能,即使處理不同的工作負載或並行使用者活動也沒問題。Amazon Redshift 使用複雜的演算法來根據執行時間和資源需求預測和分類傳入查詢,以動態管理效能和並行,同時也協助您優先處理關鍵業務工作負載。短期查詢加速 (SQA) 可將短期查詢從儀表板等應用程式傳送到快速佇列進行立即處理,無須等待大型查詢結束。自動工作負載管理 (WLM) 使用機器學習 (ML) 來動態管理記憶體和並行,協助最大化查詢輸送量。此外,您現在可以針對最重要的查詢輕鬆設定優先順序,即使要提交數百個查詢也沒關係。Amazon Redshift 也是一個自主學習系統,可觀察使用者工作負載、隨著用量提高找出改善效能的機會、無縫套用優化,以及在需要明確使用者動作以進一步大幅提高 Redshift 效能時,透過 Redshift Advisor 推薦。

結果快取:Amazon Redshift 使用結果快取,為重複的查詢提供不到一秒的回應時間。儀表板、視覺化和商業智慧工具,在執行重複的查詢時,會體驗到效能得到大幅的提升。執行查詢時,Amazon Redshift 會搜尋快取,看看是否存在先前執行過而經過快取的結果。如果找到經過快取的結果,而且資料並未改變,則會立即傳回快取結果,而非重新執行查詢。

PB 級資料倉儲:只需在主控台中按幾下滑鼠或透過簡單的 API 呼叫,就可以輕鬆變更資料倉儲中的節點數量或類型,並根據需求的變化進行擴充規模或縮小規模。使用受管儲存,其可自動新增容量以支援高達 8 PB 壓縮資料的工作負載。您也可以對 Amazon S3 中的 PB 級資料執行查詢,無須使用 Amazon Redshift Spectrum 功能負載或轉換任何資料。您可以將 S3 當作高度可用、安全且經濟實惠的資料湖,以開放資料格式存放不限數量的資料。無論查詢的複雜程度或資料數量如何,Redshift Spectrum 都能在數千個並行節點上執行查詢,以提供快速結果。

彈性的定價選項:Amazon Redshift 是最經濟實惠的資料倉儲,您可以選擇最佳付費方式。您可以在沒有承諾的情況下,從每小時 0.25 USD 的小規模開始,之後水平擴展為每年每 TB 只要 1,000 USD。Amazon Redshift 是唯一提供隨需定價、且無須預付費用的雲端資料倉儲,您可以簽訂一或三年期的預留執行個體定價,如此便可節省高達 75% 的費用,而且每個查詢定價是根據您在 Amazon S3 資料湖中掃描的資料量而定。Amazon Redshift 定價包含內建安全、資料壓縮、備份儲存和資料傳輸。隨著資料大小成長,您可以使用 RA3 執行個體中的受管儲存以符合經濟效益的方式存放資料,每月每 GB 只要 0.024 USD。

即使是不可預測的工作負載也可預測成本:因為 Amazon Redshift 的每個叢集每天最多可賺取一小時的免費並行擴展積分,讓您在擴展時能大幅降低對成本的影響。這些免費積分足以滿足 97% 客戶的並行需要。這可讓您預測每個月的成本,即使在分析需求起伏不定的期間也可進行預測。

選擇節點類型以取得最佳的工作負載價格:針對資料倉儲需求,您可以從三種執行個體類型中選擇,以優化 Amazon Redshift:RA3 節點、密集化運算節點,及密集化儲存節點。

RA3 節點可讓您獨立擴展儲存,無須顧慮運算。使用 RA3,您可以獲得將資料存放在獨立儲存層的高效能資料倉儲。您只要根據需要的查詢效能來調整資料倉儲大小即可。

密集化運算 (DC) 節點可讓您使用快速 CPU、大量的 RAM 及固態硬碟 (SSD) 來建立效能非常高的資料倉儲,對少於 500 GB 的資料是最佳選擇。

若您購買三年期預留執行個體,密集化儲存 (DS2) 節點可讓您以低價格使用硬碟 (HDD) 建立大型資料倉儲。在 DS2 叢集執行業務的大多數客戶,都可將工作負載遷移到 RA3 叢集,以與 DS2 相同的成本,享有高達兩倍的效能和更多儲存空間。

只需發出單一 API 呼叫或在 AWS 管理主控台中按幾下,即可擴展叢集或切換不同節點類型。如需詳細資訊,請瀏覽定價頁面

最安全且合規

AWS 擁有完整的安全功能,可滿足要求最高的規定,而 Amazon Redshift 提供了現成的資料安全,無須額外付費。

端對端加密:只要設定幾個參數,即可將 Amazon Redshift 設定為利用 SSL 來保護傳輸中的資料,並利用硬體加速型 AES-256 加密來保護靜態資料。如果您選擇啟用靜態資料的加密,則所有寫入磁碟的資料以及任何備份資料也會加密。根據預設,Amazon Redshift 負責金鑰的管理。

網路隔離:Amazon Redshift 讓您能設定防火牆規則,以控制對資料倉儲叢集的網路存取。您可在 Amazon Virtual Private Cloud (VPC) 中執行 Amazon Redshift,在自己的虛擬網路中隔離資料倉儲叢集,並以產業標準加密的 IPsec VPN,將其連線至您現有的 IT 基礎設施。

稽核與合規:Amazon Redshift 與 AWS CloudTrail 整合,可讓您對所有的 Redshift API 呼叫進行稽核。Redshift 會記錄所有 SQL 操作,包括連線嘗試、查詢和資料倉儲變更。您可以使用 SQL 查詢,在系統表格中存取這些日誌,或選擇將日誌儲存到 Amazon S3 上的安全位置。Amazon Redshift 符合 SOC1、SOC2、SOC3 和 PCI DSS 第 1 級法規。如需詳細資訊,請瀏覽 AWS 雲端合規

字符化:藉助 Amazon Lambda 使用者定義函數 (UDF),可讓您將 AWS Lambda 函數用作 Amazon Redshift 中的 UDF,並從 Redshift SQL 查詢中叫用此函數。有此功能,您可為 SQL 查詢撰寫自訂擴展,以實現與其他服務或第三方產品更加緊密的整合。可以撰寫 Lambda UDF,以透過與 Protegrity 等供應商整合來啟用外部字符化、資料遮罩、資料識別和去識別,同時可在查詢期間根據使用者的許可和所屬群組保護或取消保護敏感資料。 

精密的存取控制:精密的列和欄層級安全控制可確保使用者只會看到他們應該能夠存取的資料。Amazon Redshift 與 AWS Lake Formation 整合,確保 Lake Formation 的欄層級存取控制也會在 Redshift 查詢資料湖中的資料時強制套用。

查看更多最新消息

如需更詳細的產品資訊,請參閱 Amazon Redshift 文件

進一步了解 Amazon Redshift 定價

瀏覽定價頁面
準備好開始建立?
Amazon Redshift 入門
還有其他問題嗎?
聯絡我們