取得針對操作資料庫、資料湖、資料倉儲和數千個第三方資料集之複雜、可擴展資料執行即時預測分析的整合式洞察。
聯合查詢:使用 Amazon Redshift 中的全新聯合查詢功能,您可以連到操作的關聯式資料庫。查詢一個或多個 Amazon Relational Database Service (RDS)、Aurora PostgreSQL、RDS MySQL 和 Aurora MySQL 資料庫中的即時資料,無需移動資料即可即時掌握完整的業務營運狀況。您可以聯結來自 Redshift 資料倉儲的資料、資料湖中的資料,還可聯結操作存放區的資料,以便做出更佳的資料驅動決策。Amazon Redshift 提供最佳化功能,降低透過網路移動的資料,並使用大規模平行資料處理作為輔助,以進行高效能的查詢。進一步了解。
資料共用:Amazon Redshift 資料共用可讓您將 Amazon Redshift 在單一叢集中提供的易用性、效能和成本優勢擴展至多叢集部署,同時能夠共用資料。資料共享可跨 Redshift 叢集實現即時、精細和快速資料存取,而無需對其複製或移動。資料共享可即時存取資料,以便您的使用者在資料倉儲中更新時,始終能看到最新且一致的資訊。您可以在相同或不同的 AWS 帳戶中以及跨區域,與 Redshift 叢集安全地共享即時資料。進一步了解。
適用於 Amazon Redshift 的 AWS Data Exchange:從您自己的 Redshift 叢集查詢 Amazon Redshift 資料集,而無須擷取、轉換和載入 (ETL) 資料。您可以在 AWS Data Exchange 中訂閱 Redshift 雲端資料倉儲產品。一旦供應商進行更新,訂閱用戶就能看到變更。如果您是資料提供者,則會在訂閱開始時自動授予存取權,並在訂閱結束時撤銷存取權;付款到期時會自動產生發票,並透過 AWS 收取付款。您可以透過單一訂閱授權存取平面檔案、Amazon Redshift 中的資料,以及透過 API 交付的資料。進一步了解。
Redshift ML:Redshift ML 可讓資料分析師、資料科學家、商業智慧專業人員和開發人員使用 SQL 輕鬆地建立、訓練和部署 Amazon SageMaker 模型。藉助 Redshift ML,您可以使用 SQL 陳述式根據 Amazon Redshift 中的資料建立和訓練 Amazon SageMaker 模型,然後直接在查詢和報告中使用這些模型進行客戶流失偵測、財務預測、個人化和風險評分等預測。進一步了解。
適用於 Apache Spark 的 Amazon Redshift 整合:此功能可讓您輕鬆地根據 Amazon Redshift 資料建置和執行 Apache Spark 應用程式,讓客戶能為更廣泛的分析和機器學習解決方案開放資料倉儲。透過適用於 Apache Spark 的 Amazon Redshift 整合,使用 AWS 分析和 ML 服務 (例如 Amazon EMR、AWS Glue、Amazon Athena Spark 和 Amazon SageMaker) 的開發人員可以在幾秒鐘內開始使用,並輕鬆建立可從 Amazon Redshift 資料倉儲讀取和寫入的 Apache Spark 應用程式,而不會影響應用程式效能或資料的交易一致性。適用於 Apache Spark 的 Amazon Redshift 整合也可讓您更輕鬆地監控和疑難排解 Apache Spark 應用程式與 Amazon Redshift 一起使用時的效能問題。
Amazon Aurora Zero-ETL to Amazon Redshift:這是 Amazon Aurora 和 Amazon Redshift 之間的無程式碼整合,可讓 Amazon Aurora 客戶在 PB 級的交易資料上使用 Amazon Redshift 進行近乎即時的分析和機器學習。在將交易資料寫入 Amazon Aurora 的幾秒鐘內,Amazon Aurora Zero-ETL to Amazon Redshift 就能順暢地在 Amazon Redshift 中使用資料,讓客戶無需建立和維護執行擷取、轉換和載入 (ETL) 操作的複雜資料管道。此整合可降低營運負擔和成本,並讓客戶專注於改善應用程式。透過近乎即時的交易資料存取,客戶能利用 Amazon Redshift 的分析和機器學習功能,從交易和其他資料衍生洞察,有效地回應關鍵的時間敏感事件。
串流擷取:資料工程師、資料分析師和大數據開發人員正在使用即時串流引擎來改善客戶回應速度。透過 Amazon Redshift 中的全新串流擷取功能,您可以使用 SQL (結構化查詢語言) 連線至 Amazon Kinesis Data Streams 及 Amazon Managed Streaming for Apache Kafka (MSK),並直接擷取資料。Amazon Redshift 串流擷取也可讓您直接在串流之上建立具體化視觀表,讓您輕鬆建立和管理下游管道。具體化視觀表也可以包含做為 ELT (擷取載入轉換) 管道部分之一的 SQL 轉換。您可以手動重新整理定義的具體化視觀表,以查詢最新的串流資料。這種方法可讓您使用熟悉的現有工具執行串流資料的下游處理和轉換,而無需額外費用。
從您的資料湖進行查詢並匯入和匯出資料:沒有其他雲端資料倉儲可以用如此簡單的方式查詢資料,並以各種開放格式將資料寫回您的資料湖。您可以查詢 Parquet、ORC、JSON、Avro、CSV 等開放檔案格式,並使用熟悉的 ANSI SQL 在 Amazon S3 進行更直接的查詢。要將資料匯出您的資料湖,只需在 SQL 程式碼使用 Amazon Redshift UNLOAD 命令,並將 Parquet 指定為檔案格式,Amazon Redshift 就能自動設定資料格式,然後將資料移至 S3。這可讓您靈活地將經常存取的高度結構化的資料和半結構化資料存放在 Amazon Redshift 資料倉儲中,同時在 Amazon S3 中保留 EB 規模的結構化、半結構化和非結構化資料。將資料從 Amazon Redshift 匯回資料湖可讓您使用 Amazon Athena、Amazon EMR 和 Amazon SageMaker 等 AWS 服務來進一步分析資料。
AWS 服務整合:與 AWS 服務、資料庫和機器學習服務的原生整合可讓您輕鬆處理完整的分析工作流程,而不會造成摩擦。例如,AWS Lake Formation 是能在幾天內輕鬆設定安全資料湖的服務。AWS Glue 可以將資料擷取、轉換和載入 (ETL) 到 Amazon Redshift。要擷取、轉換串流資料,並將其載入 Amazon Redshift 以進行近乎即時分析,Amazon Kinesis Data Firehose 是最簡單的方法。您可以使用 Amazon EMR 透過 Hadoop/Spark 處理資料,並將輸出載入至 Amazon Redshift 用於商業智慧和分析。Amazon QuickSight 是第一個採用按工作階段付費定價的商業智慧服務,可用於建立 Redshift 資料的報告、視覺化和儀表板。您可以使用 Amazon Redshift 準備資料,以便利用 Amazon SageMaker 執行機器學習 (ML) 工作負載。若要加速遷移至 Amazon Redshift,您可以使用 AWS Schema Conversion Tool 和 AWS Database Migration Service (DMS)。Amazon Redshift 還與 Amazon Key Management Service (KMS) 和 Amazon CloudWatch 深度整合,以實現安全性、監控和合規。您還可以使用 Lambda 使用者定義函數 (UDF),從 SQL 查詢中叫用 Lambda 函數,就像在 Amazon Redshift 中叫用 UDF 一樣。可以撰寫 Lambda UDF 以整合 AWS 合作夥伴服務並存取其他熱門的 AWS 服務,例如 Amazon DynamoDB 和 Amazon SageMaker。
合作夥伴主控台整合:可透過以下方式,在幾分鐘內加速資料採用並形成極具價值的商業洞見:在 Amazon Redshift 主控台中整合精選的合作夥伴解決方案。使用這些解決方案,您可以將來自 Salesforce、Google Analytics、Facebook Ads、Slack、Jira、Splunk 和 Marketo 之類應用程式中的資料高效、簡化地帶入 Redshift 資料倉儲。這還可讓您加入這些不同的資料集並進行分析,以形成可行的洞察。
從 Amazon S3 自動複製:Amazon Redshift 支援自動複製,以簡化和自動從 Amazon S3 載入資料,減少建立自訂解決方案或管理第三方服務的時間和精力。透過此功能,Amazon Redshift 可自動化檔案擷取並處理持續的資料載入步驟,讓您不再需要手動和重複執行複製程序。自動複製支援可讓業務營運使用者和資料分析師輕鬆地在沒有任何資料工程知識的情況下輕鬆建立擷取規則,並設定他們希望從 Amazon S3 載入的資料位置。新資料落入指定的 Amazon S3 資料夾時,擷取程序會根據使用者定義的組態自動觸發。Redshift 複製命令支援所有檔案格式,包括 CSV、JSON、Parquet 和 Avro。
原生支援進階分析:Amazon Redshift 支援標準純量資料類型,例如 NUMBER、VARCHAR 和 DATETIME,同時為以下進階分析處理提供原生支援:
透過自動化最佳化功能提高查詢速度,可獲得比其他雲端資料倉儲提升高達 5 倍的價格效能。
RA3 執行個體:RA3 執行個體所提供的價格效能是任何雲端資料倉儲服務的 5 倍。這些 Amazon Redshift 執行個體可針對需要大量運算容量的效能密集型工作負載將速度最大化,並讓您彈性指定所需的執行個體數量,以分開支付運算和儲存的費用。 進一步了解。
有效率的儲存和高效能查詢處理:Amazon Redshift 可針對 GB 到 PB 規模之間任何大小的資料集提供快速查詢效能。單欄式儲存、資料壓縮及區域映射降低了執行查詢所需的 I/O 數量。除了 LZO 和 Zstandard 這類產業標準編碼,Amazon Redshift 還針對數字和日期/時間類型提供專用壓縮編碼 AZ64,可節省儲存和優化查詢效能。
無限並行性:Amazon Redshift 即使有數千個並行查詢也能提供一致的快速效能,無論在 Redshift 資料倉儲查詢資料或直接在 Amazon S3 資料湖查詢皆可。Amazon Redshift 並行擴展可支援幾乎無限個並行使用者和並行查詢,並在並行數量增加時,於幾秒內新增暫時的容量,以提供一致的服務水準。 進一步了解。
具體化視觀表:Amazon Redshift 具體化視觀表可大幅加快查詢效能,使儀表板等反覆運作或可預測的分析工作負載、商業智慧 (BI) 工具查詢,以及擷取、轉換和載入 ELT 資料處理任務受惠。您可以使用具體化視觀表,輕鬆地儲存和管理同時引用一或多個資料表,包括外部資料表的 SELECT 語句的預先運算結果。透過重複使用預先運算的結果,參考具體化視觀表的後續查詢可大幅加快執行速度。Amazon Redshift 可以用增量改進方式有效維護具體化視觀表,以持續提供低延遲效能的利益。 進一步了解。
自動化具體化視觀表:企業正在建置比以往更多與資料相關的應用程式、儀表板、報告和臨機操作查詢。每個應用程式都需要進行調整和最佳化,這需要時間、資源和金錢。具體化視觀表是提高查詢效能的強大工具,如果您對工作負載有充分了解,就能設定具體化視觀表。然而,在查詢模式無法預測的情況下,工作負載可能會增加和變更。自動具體化視觀表透過自動重新整理、自動查詢重新寫入、累加式重新整理,以及持續監控 Amazon Redshift 叢集,以提高查詢的輸送量、降低查詢延遲、縮短執行時間。Amazon Redshift 能以最低的資源使用率來平衡 AutoMV 的建立和管理。 進一步了解。
使用機器學習最大化輸送量和效能:Amazon Redshift 的進階機器學習功能可提供高輸送量和效能,即使處理不同的工作負載或並行使用者活動也沒問題。Amazon Redshift 使用複雜的演算法來根據執行時間和資源需求預測和分類傳入查詢,以動態管理效能和並行,同時也協助您優先處理關鍵業務工作負載。短期查詢加速 (SQA) 可將短期查詢從儀表板等應用程式傳送到快速佇列進行立即處理,無須等待大型查詢結束。自動工作負載管理 (WLM) 使用機器學習來動態管理記憶體和並行,協助最大化查詢輸送量。此外,您現在可以針對最重要的查詢輕鬆設定優先順序,即使已提交數百個查詢也沒關係。Amazon Redshift 也是一個自主學習系統,可觀察使用者工作負載、隨著用量提高找出改善效能的機會、無縫套用優化,以及在需要明確使用者動作以進一步大幅提高 Redshift 效能時,透過 Redshift Advisor 提供建議。
結果快取:Amazon Redshift 使用結果快取,為重複的查詢提供不到一秒的回應時間。儀表板、視覺化和商業智慧工具,在執行重複的查詢時,會體驗到效能得到大幅的提升。執行查詢時,Amazon Redshift 會搜尋快取,看看是否存在先前執行過而經過快取的結果。若找到快取過的結果,且資料並未改變,則會立即傳回快取結果,而非重新執行查詢。
PB 級資料倉儲:只需在主控台中按幾下滑鼠或透過簡單的 API 呼叫,就可以輕鬆變更資料倉儲中的節點數量或類型,並根據需求的變化進行縱向擴展或縮小規模。使用受管儲存,其可自動新增容量以支援高達 8 PB 壓縮資料的工作負載。您也可以對 Amazon S3 中的 PB 級資料執行查詢,無須使用 Amazon Redshift Spectrum 功能載入或轉換任何資料。您可以將 S3 當作高度可用、安全且經濟實惠的資料湖,將不限數量的資料存放為開放資料格式。無論查詢的複雜程度或資料數量如何,Redshift Spectrum 都能在數千個並行節點上執行查詢,以提供快速結果。
彈性的定價選項:Amazon Redshift 是最經濟實惠的資料倉儲,您可以最佳化付款方式。您可以在沒有承諾的情況下,從每小時 0.25 USD 的小規模開始,之後橫向擴展每年每 TB 只要 1000 USD。Amazon Redshift 是唯一提供隨需定價、且無須預付費用的雲端資料倉儲,您可以簽訂 1 或 3 年期的預留執行個體定價,如此便可節省高達 75% 的費用,而且每個查詢定價是根據您在 Amazon S3 資料湖中掃描的資料量而定。Amazon Redshift 定價包含內建安全、資料壓縮、備份儲存和資料傳輸。隨著資料大小成長,您可以使用 RA3 執行個體中的受管儲存以符合經濟效益的方式存放資料,每月每 GB 只要 0.024 USD。
即使是不可預測的工作負載也可預測成本:因為 Amazon Redshift 的每個叢集每天最多可賺取一小時的免費並行擴展積分,讓您在擴展時能大幅降低對成本的影響。這些免費積分足以滿足 97% 客戶的並行需要。這可讓您預測每個月的成本,即使在分析需求起伏不定的期間也可進行預測。
選擇節點類型以取得最佳的工作負載價格:針對資料倉儲需求,您可以從三種執行個體類型中選擇,以最佳化 Amazon Redshift:RA3 節點、密集運算節點和密集化儲存節點。
RA3 節點可讓您獨立擴展儲存,無須顧慮運算。使用 RA3,您可以獲得將資料存放在獨立儲存層的高效能資料倉儲。您只要根據需要的查詢效能來調整資料倉儲大小即可。
密集化運算 (DC) 節點可讓您使用快速 CPU、大量的 RAM 及固態硬碟 (SSD) 來建立效能非常高的資料倉儲,對少於 500 GB 的資料是最佳選擇。
密集化儲存 (DS2) 節點可讓您在購買三年期預留執行個體時,以低價使用硬碟 (HDD) 建立大型資料倉儲。在 DS2 叢集執行業務的大多數客戶,都可將工作負載移轉到 RA3 叢集,以與 DS2 相同的價格,享有高達兩倍效能和更多儲存空間。
只需發出單一 API 呼叫或在 AWS 管理主控台中按幾下,即可擴展叢集或切換不同節點類型。如需詳細資訊,請瀏覽定價頁面。
可專心在數秒內從資料獲得洞察,交出業務成果,不必為管理資料倉儲擔憂。
Amazon Redshift Serverless:Amazon Redshift Serverless 是 Amazon Redshift 的無伺服器選項,可讓您在幾秒內輕鬆執行分析並進行擴展,無需設定和管理資料倉儲基礎架構。使用 Amazon Redshift Serverless,任何使用者—包括資料分析師、開發人員、商業專業人員和資料科學家—只需負載並查詢資料倉儲中的資料,便能從資料獲得洞察。 進一步了解。
查詢編輯器 v2:使用 SQL 可讓 Amazon Redshift 的資料和資料湖更便於資料分析師、資料工程師及其他 SQL 使用者存取,以利用 Web 分析工作台執行資料探索和分析。查詢編輯器 v2 可讓您以單鍵動作將查詢結果視覺化、建立結構和表格、以視覺方式負載資料,及瀏覽資料庫物件。此外也是一種符合直觀的編輯器,可編寫與分享 SQL 查詢、分析、視覺化和註解,還能與團隊安全地共用。
自動化表格設計:Amazon Redshift 能監控使用者工作負載,同時使用複雜的演算法來探尋改善資料實體佈局以最佳化查詢速度的方法。自動表格優化會選擇最合適的排序和分佈金鑰,以優化叢集工作負載的效能。如果 Amazon Redshift 確定運用金鑰會提高叢集效能,則表格將自動得到更改,而無需管理員的介入。自動 Vacuum 刪除、自動表格排序和自動分析等其他功能可避免對 Redshift 叢集進行手動維護和調校,從而為新叢集和生產工作負載取得最佳效能。
以本身的工具進行查詢:Amazon Redshift 賦予您靈活性,可在主控台內執行查詢,亦可連接 SQL 用戶端工具、程式庫或資料科學工具,包括 Amazon QuickSight、Tableau、PowerBI、QueryBook 和 Jupyter 筆記本。
與 Amazon Redshift 互動的簡單 API:Amazon Redshift 可讓您使用所有類型的傳統、雲端原生、容器化、無伺服器 Web 服務應用程式和事件驅動式應用程式,輕鬆存取資料。Amazon Redshift Data API 可簡化資料存取、擷取以及從 AWS SDK 支援的程式設計語言和平台輸出,例如 Python、Go、Java、Node.js、PHP、Ruby 和 C++。資料 API 可讓您無需設定驅動程式和管理資料庫連線。現在只需叫用資料 API 提供的安全 API 端點,即可對 Amazon Redshift 叢集執行 SQL 命令。資料 API 會負責管理資料庫連線和緩衝資料。資料 API 是非同步的,因此您可以稍後再擷取結果。您的查詢結果會儲存長達 24 小時。
容錯能力:有多種可增強資料倉儲叢集可靠性的功能。例如,Amazon Redshift 會持續監控叢集的運作狀態,並自動從故障的磁碟機重新複寫資料,還會在必要時替換節點,以提供容錯能力。也可以將叢集重新放置到替代的可用區域 (AZ),而不會丟失任何資料或變更應用程式。
AWS 擁有完整的安全功能,可滿足要求最高的規定,而 Amazon Redshift 提供了現成的資料安全,無須額外付費。
精細的存取控制:精細的列和欄層級安全控制,可確保使用者只會看到他們應該存取的資料。Amazon Redshift 可與 AWS Lake Formation 整合,確保 Lake Formation 的欄層級存取控制也會在 Redshift 查詢資料湖資料時強制套用。
Amazon Redshift 資料共享支援 AWS Lake Formation 的集中式存取控制,以簡化從 Amazon Redshift 共享的資料之管理。AWS Lake Formation (LF) 是一項服務,可讓您輕鬆設定安全資料湖、集中管理所有使用服務之間的資料細微存取,以及套用資料列層級和欄層級控制。
動態資料遮罩:使用動態資料遮罩,客戶可以限制使用者可以看見的可識別資料量,輕鬆保護敏感性資料;此外,還可以在這些欄位上定義多個許可層級,讓不同的使用者和群組可以擁有不同層級的資料存取權,而不必建立多個資料副本,而這一切都可透過 Redshift 熟悉的 SQL 介面進行。
多可用區:全新 Redshift 多可用區設定可縮短復原時間,並保證能夠自動復原而不會遺失資料,進一步擴充復原功能。Redshift 多可用區資料倉儲可提供高可用性,而無需使用待命資源,將效能和價值最大化。
端對端加密:只要設定一些參數,即可將 Amazon Redshift 設定為利用 SSL 來保護傳輸中的資料,並利用硬體加速型 AES-256 加密來保護靜態資料。如果您選擇啟用靜態資料的加密,則所有寫入硬碟的資料以及任何備份資料也將被加密。根據預設,Amazon Redshift 負責金鑰的管理。
網路隔離:Amazon Redshift 讓您能設定防火牆規則,以控制對資料倉儲叢集的網路存取。您可在 Amazon Virtual Private Cloud (VPC) 中執行 Amazon Redshift,在自己的虛擬網路中隔離資料倉儲叢集,並以產業標準加密的 IPsec VPN,將其連接至您現有的 IT 基礎架構。
稽核與合規:Amazon Redshift 與 AWS CloudTrail 整合,可讓您對所有的 Redshift API 呼叫進行稽核。Redshift 會記錄所有 SQL 操作,包括連接嘗試、查詢和資料倉儲變更。您可以使用 SQL 查詢,在系統表格中存取這些記錄,或將記錄儲存到 Amazon S3 上的安全位置。Amazon Redshift 符合 SOC1、SOC2、SOC3 和 PCI DSS 第 1 級法規。如需詳細資訊,請瀏覽 AWS 雲端合規。
記號化:藉助 Amazon Lambda 使用者定義函數 (UDF),可以將 AWS Lambda 函數用作 Amazon Redshift 中的 UDF,並從 Redshift SQL 查詢中叫用此函數。使用此功能,您可以為 SQL 查詢編寫自訂擴展,以實現與其他服務或第三方產品更加緊密的整合。可以撰寫 Lambda UDF,以透過與 Protegrity 等供應商整合來啟用外部字符化、資料遮罩、資料識別和去識別,同時可在查詢期間根據使用者的許可和所屬群組保護或取消保護敏感資料。
查看更多最新消息。
如需更詳細的產品資訊,請瀏覽 Amazon Redshift 文件。