- 分析›
- Amazon Redshift›
- Amazon Redshift 功能
實現卓越的價格效能、擴展性和安全性
RA3 執行個體
RA3 執行個體可針對需要大量運算容量的效能密集型工作負載將速度最大化,並讓您靈活地指定所需的執行個體數量,以分開支付運算資源和儲存的費用。
高效率儲存和高效能查詢處理
單欄式儲存、資料壓縮及區域映射降低了執行查詢所需的 I/O 數量。除了 LZO 和 Zstandard 這類產業標準編碼,Amazon Redshift 還針對數字以及日期和時間類型提供專用壓縮編碼 AZ64,可節省儲存空間和最佳化查詢效能。
並行擴展
可支援幾乎無限個並行使用者和並行查詢,並在並行數量增加時,於幾秒內新增暫時的容量,以提供一致的服務水準。以最小的成本影響進行擴展,因為每個叢集每天最多可獲得一小時的免費並行擴展積分。這些免費積分足以滿足 97% 客戶的並行需要。
透過資料共享進行多資料倉儲寫入
可支援幾乎無限個並行使用者和並行查詢,並在並行數量增加時,於幾秒內新增暫時的容量,以提供一致的服務水準。以最小的成本影響進行擴展,因為每個叢集每天最多可獲得一小時的免費並行擴展積分。這些免費積分足以滿足 97% 客戶的並行需要。
具體化視觀表
Amazon Redshift 具體化視觀表可大幅加快查詢效能,使儀表板等反覆運作,或使可預測的分析工作負載、商業智慧 (BI) 工具查詢,以及擷取、轉換和載入 ELT 資料處理任務受惠。您可以使用具體化視觀表,儲存和管理同時引用一或多個資料表 (包括資料湖、零 ETL 和資料共用資料表) 的 SELECT 語句的預先運算結果。藉助增量重新整理功能,Amazon Redshift 會識別在先前重新整理後發生的基礎資料中的變更,並僅更新具體化視觀表中的對應記錄。增量重新整理比完整重新整理更快速執行,並可提高工作負載效能。
結果快取
為重複查詢提供低於 1 秒的回應時間。採用儀表板、視覺化和 BI 工具,在執行重複的查詢時,會體驗到效能得到大幅的提升。執行查詢時,Amazon Redshift 會搜尋快取,看看是否存在先前執行過而經過快取的結果。若找到快取過的結果,且資料並未改變,則會立即傳回快取結果,而非重新執行查詢。
多維資料佈局 (MDDL)
功能強大的全新資料表排序機制,可根據傳入查詢篩選器 (例如:特定區域的銷售) 自動排序資料,從而改善重複式查詢的效能。與傳統方法相比,此方法顯著加速資料表掃描的效能。
異地同步備份
縮短復原時間,並保證能夠自動復原而不會遺失資料,進一步擴充復原功能。Amazon Redshift 多可用區資料倉儲無需使用待命資源即可提供高可用性,同時將可用性提升至 99.99% SLA,從而最大限度提升效能和價值。
網路隔離
Amazon Redshift 讓您能設定防火牆規則,以控制對資料倉儲叢集的網路存取。您可在 Amazon Virtual Private Cloud (Amazon VPC) 中執行 Amazon Redshift,在自己的虛擬網路中隔離資料倉儲叢集,並以產業標準加密的 IPsec VPN,將其連線至您現有的 IT 基礎設施。
端對端加密
僅需設定幾個參數,即可將 Amazon Redshift 設定為利用 TLS 來保護傳輸中的資料,並利用硬體加速型 AES-256 加密來保護靜態資料。如果您選擇啟用靜態資料的加密,則所有寫入硬碟的資料以及任何備份資料也將被加密。根據預設,Amazon Redshift 負責金鑰的管理。
透過 AWS IAM Identity Center 整合進行統一身分識別
與 IAM Identity Center 整合可讓組織支援 Amazon Redshift、Amazon QuickSight,以及 AWS Lake Formation 之間受信任的身分傳播。您可以透過第三方身分提供者 (IdP),例如 Microsoft Entra ID、Okta、Ping、OneLogin 等,使用自己的組織身分單一登入,從 Amazon QuickSight 和 Amazon Redshift 查詢編輯器以及第三方 BI 工具和 SQL 編輯器存取 Amazon Redshift。管理員可以使用第三方 IdP 的使用者和群組來管理跨服務對資料的微點存取,並在 AWS CloudTrail 中稽核使用者層級存取權。透過受信任的身分傳播功能,使用者的身分可在 QuickSight、Amazon Redshift 和 Lake Formation 之間順暢傳遞,從而縮短取得洞見的時間,並實現無摩擦的分析體驗。
精細的存取控制
精細的列和欄層級安全控制,可確保使用者僅會看到他們應該存取的資料。Amazon Redshift 與 Lake Formation 整合,確保 Lake Formation 中的欄層級存取控制也會在 Amazon Redshift 查詢資料湖資料時強制套用。Amazon Redshift 資料共用支援 Lake Formation 的集中式存取控制,以簡化從 Amazon Redshift 共享的資料之管理。Lake Formation 是一項服務,可讓您更加輕鬆地設定安全資料湖、集中管理所有使用服務之間的資料細微存取,以及套用資料列層級和欄層級控制。藉助動態資料遮罩功能,可透過限制使用者可見的可識別資料量來保護您的敏感性資料。在這些欄位上定義多個層級的許可,以便不同的使用者和群組可以擁有不同層級的資料存取權,而無需建立多個資料副本,所有這些任務均透過熟悉的 Amazon Redshift SQL 介面完成。
利用 SQL 跨資料湖中的統一資料解鎖洞見
與 Amazon SageMaker Lakehouse 整合
藉助 Amazon Redshift 與 SageMaker Lakehouse 的整合,使用 SQL 分析所有統一的資料。以開放格式查詢 Amazon Simple Storage Service (Amazon S3) 資料,從而避免在資料湖和倉儲之間移動資料。在 SageMaker Lakehouse 中開啟 Amazon Redshift 資料,以便跨 AWS 和 Apache Iceberg 分析工具進行存取,並且支援全面的資料分析和機器學習 (ML)。
資料湖查詢支援開放資料表和開放資料格式,包括 Apache Iceberg
Amazon Redshift 支援在 Apache Iceberg、Apache Hudi 和 Delta Lake 資料表格式上使用熟悉的 ANSI SQL 進行唯讀查詢,以及直接在 Amazon S3 中查詢包括 Apache Parquet、ORC、Avro、JSON 和 CSV 在內的開放檔案格式。Apache Iceberg 是開放原始碼資料表格式的範例,透過其資料表結構提供事務一致性和增強的資料湖組織。Amazon Redshift Spectrum 可讓您從資料湖中的資料表和 Parquet 等開放資料格式的資料中讀取資料,同時在 Amazon S3 中存放高達 EB 規模的結構化、半結構化和非結構化資料。您也可以使用 Amazon Redshift UNLOAD 命令將資料匯出至資料湖,包括匯出至 Parquet 的選項。將資料從 Amazon Redshift 匯回資料湖可讓您使用 Amazon Athena、Amazon EMR 和 SageMaker 等 AWS 服務來進一步分析資料。
Amazon Redshift 查詢編輯器
使用 SQL 可讓 Amazon Redshift 的資料和資料湖更便於資料分析師、資料工程師及其他 SQL 使用者存取,以利用 Web 分析工作台執行資料探索和分析。查詢編輯器可讓您以單一步驟將查詢結果視覺化、建立結構和資料表、以視覺方式載入資料,以及瀏覽資料庫物件。這也是一種符合直觀的編輯器,可編寫與分享 SQL 查詢、分析、視覺化和註解,還能與團隊安全地共用。
Amazon SageMaker Unified Studio (預覽版)
在 SageMaker Unified Studio (一種資料和 AI 開發環境) 中,使用 Amazon Redshift 提供支援的內建 SQL 編輯器查詢儲存在資料湖、資料倉儲、資料庫和應用程式中的資料。
利用近乎即時的分析加速決策
Amazon S3 自動複製支援
簡化和自動從 Amazon S3 擷取資料,減少建立自訂解決方案或管理第三方服務的時間和精力。透過此功能,Amazon Redshift 可自動化檔案擷取並處理持續的資料載入步驟,讓您不再需要手動和重複執行複製程序。自動複製支援可讓業務營運使用者和資料分析師更加輕鬆地在沒有任何資料工程知識的情況下建立擷取規則,並設定他們希望從 Amazon S3 載入的資料位置。
Amazon Redshift 串流擷取
使用 SQL 連線至 Amazon Kinesis Data Streams 及 Amazon Managed Streaming for Apache Kafka (Amazon MSK),並直接擷取資料。Amazon Redshift 串流擷取也可讓您直接在串流之上建立具體化視觀表,讓您輕鬆建立和管理下游管道。具體化視觀表也可以包含做為 ELT 管道部分之一的 SQL 轉換。您可以手動重新整理定義的具體化視觀表,以查詢最新的串流資料。
聯合查詢
在一或多個 Amazon RDS 執行個體中查詢即時資料,包括 Amazon Aurora PostgreSQL 相容版、Amazon Relational Database (Amazon RDS) for MySQL 以及 Amazon Aurora MySQL 相容版本資料庫,無需移動資料即可即時掌握完整的業務營運狀況。
無需管理基礎設施即可輕鬆取得 SQL 分析
無伺服器
在幾秒鐘內執行分析並擴展,無需設定和管理資料倉儲基礎架構。AI 驅動擴展和最佳化技術 (提供預覽版) 讓 Amazon Redshift Serverless 能夠自動主動佈建和擴展資料倉儲容量,即使是最嚴苛的工作負載也能提供快速效能。系統使用 AI 技術來學習各種關鍵維度的客戶工作負載模式,例如並行查詢、查詢複雜性、資料量湧入以及 ETL 模式。接著會一整天不斷調整資源,並套用量身打造的效能最佳化。您可以設定所需的效能目標,資料倉儲會自動擴展以維持一致的效能。
自主
複雜的演算法可根據執行時間和資源需求預測和分類傳入查詢,以動態管理效能和並行,同時也協助您優先處理關鍵業務工作負載。短期查詢加速 (SQA) 可將短期查詢從儀表板等應用程式傳送到快速佇列進行立即處理,無須等待大型查詢結束。自動工作負載管理 (WLM) 使用 ML 來動態管理記憶體和並行,協助最大化查詢輸送量。此外,您現在可以針對最重要的查詢設定優先順序,即使已提交數百個查詢亦可輕鬆設定。當需要明確的使用者行動以進一步提升 Amazon Redshift 效能時,Amazon Redshift Advisor 會提出建議。對於查詢模式不可預測的動態工作負載,自動具體化視觀表透過自動重新整理、自動查詢重新寫入、累加式重新整理,以及持續監控 Amazon Redshift 叢集,以提高查詢的輸送量、降低查詢延遲、縮短執行時間。自動資料表最佳化會選取排序和分佈金鑰,以最佳化叢集工作負載的效能。如果 Amazon Redshift 確定運用金鑰會提高叢集效能,則表格將自動得到更改,而無需管理員的介入。自動 Vacuum 刪除、自動資料表排序和自動分析等其他功能可免除對 Amazon Redshift 叢集進行手動維護和調校,從而為新叢集和生產工作負載取得最佳效能。
資料 API
使用簡單的 API 與 Amazon Redshift 互動:Amazon Redshift 可讓您使用所有類型的傳統、雲端原生、容器化、無伺服器 Web 應用程式和事件驅動式應用程式,輕鬆存取資料。Amazon Redshift Data API 可簡化資料存取、擷取以及從 AWS SDK 支援的程式設計語言和平台輸出,例如 Python、Go、Java、Node.js、PHP、Ruby 和 C++。Data API 可讓您無需設定驅動程式和管理資料庫連線。現在透過叫用 Data API 提供的安全 API 端點,即可對 Amazon Redshift 叢集執行 SQL 命令。資料 API 會負責管理資料庫連線和緩衝資料。資料 API 是非同步的,因此您可以稍後再擷取結果。您的查詢結果會儲存長達 24 小時。
與第三方 ETL 和 BI 工具整合
在主控台中執行查詢,或者連線 SQL 用戶端工具、程式庫或資料科學工具,包括 QuickSight、Tableau、Microsoft Power BI、Alteryx、Querybook、Jupyter Notebook、Informatica、dbt、MicroStrategy 和 Looker。
利用生成式 AI 情境化應用程式並提高使用者生產力
查詢編輯器中的 Amazon Q 生成式 SQL
在 Amazon Redshift 查詢編輯器中使用純英文撰寫查詢,從而在資料存取許可範圍內安全地產生準確的 SQL 程式碼建議。
Amazon Redshift ML
Amazon Redshift ML 可讓資料分析師、資料科學家、BI 專業人員,以及開發人員使用 SQL 更加輕鬆地建立、訓練和部署 SageMaker 模型。藉助 Amazon Redshift ML,您可以使用 SQL 陳述式根據 Amazon Redshift 中的資料建立和訓練 SageMaker 模型,然後直接在查詢和報告中使用這些模型進行客戶流失偵測、財務預測、個人化和風險評分等預測。將大型語言模型引入 Amazon Redshift 以執行進階自然語言處理任務,例如文字摘要、實體擷取和情緒分析,從而使用 SQL 從資料中取得更深入的洞見。