Amazon Redshift Spectrum 讓您能夠對 Amazon S3 中 EB 級的資料執行 Amazon Redshift SQL 查詢。透過 Redshift Spectrum,Amazon Redshift 的分析能力不僅可應用在資料倉儲中本機磁碟存放的資料,還可查詢 Amazon S3「資料湖」中的大量非結構化資料,無須載入或轉換任何資料。Redshift Spectrum 套用精密的查詢優化、擴展數千個節點的處理程序,因此即使是龐大的資料集和複雜的查詢也能快速取得結果。

Redshift Spectrum 可透過您已使用的 Avro、CSV、Grok、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV 等開放資料格式,直接查詢 Amazon S3 中的資料。因為 Redshift Spectrum 支援與 Amazon Redshift 相同的 SQL 語法,所以您可以利用現在使用的相同商業智慧 (BI) 工具執行精密的查詢。您也可以跨 Amazon Redshift 本機存放的經常存取資料和 Amazon S3 中以經濟實惠方式存放的完整資料集執行查詢。

Redshift Spectrum 可讓您自由選擇存放資料的位置、存放的格式,而且讓您在需要處理資料時隨時可用。使用 Redshift Spectrum 無須預付款或簽訂合約;您只需支付所執行查詢的費用。

準備好開始查詢嗎?

開始使用 Amazon Redshift
Dory_Feature_Start_Querying_Instantly

使用 Amazon Redshift Spectrum,您可以立即開始查詢 Amazon S3 中的資料,無須載入或轉換。您只需將 Amazon AthenaAWS Glue 資料型錄或 Apache Hive 中繼存放區註冊為外部結構描述即可。您可以使用查詢 Amazon Redshift 表所使用的相同 SQL 和目前支援 Redshift 的任何 BI 工具。

Dory_Feature_Fast_Performance

無論針對 Amazon S3 中龐大非結構化資料集的臨機操作分析或 Redshift 表中結構化資料集的經常性分析,Amazon Redshift 都能提供超快速的效能。您可以將熱資料保留在 Amazon Redshift 叢集以取得本機磁碟的效能,並使用 Amazon Redshift Spectrum 將查詢擴展到存放在 Amazon S3 的冷資料,以取得無限的可擴展性和低成本。Amazon Redshift 查詢優化程式會自動判斷如何盡量減少 Amazon S3 中掃描的資料,以及查詢中要使用的 Redshift Spectrum 節點數量。

Dory_Feature_Scalable

使用 Amazon Redshift Spectrum 無須擔心叢集的擴展問題。您可以將儲存和運算分開,個別獨立擴展。您甚至可以對同一個 Amazon S3 資料湖執行多個 Amazon Redshift 叢集,實現無限制的並行。Redshift Spectrum 可視需要自動擴展到數千個執行個體,所以無論處理 TB、PB 或 EB 級的資料都能快速執行查詢。

Dory_Feature_Pay_per_query

使用 Amazon Redshift Spectrum,您只需支付所執行查詢的費用。執行查詢處理的資料每 TB 需支付 5 USD。Redshift Spectrum 可查詢壓縮資料。將資料壓縮、分割再轉換為單欄格式,每個查詢的成本可節省 30% 到 90% 且可提升效能。沒有執行查詢時無須支付 Redshift Spectrum 費用。只需支付資料儲存的標準 Amazon S3 費用以及所使用叢集的 Amazon Redshift 執行個體費用。