單欄式資料庫針對讀取和寫入資料欄 (而非資料列) 進行了優化。資料庫表格的欄導向儲存在分析查詢效能是非常重要的因素,因為它可大幅降低整體磁碟 I/O 需求,同時減少需要從磁碟載入的資料量。

和其他 NoSQL 資料庫一樣,欄導向資料庫旨在使用低成本硬體的分散式叢集進行「橫向」擴展以提高輸送量,因此非常適用於資料倉儲大數據處理。

開始免費使用 AWS

建立免費帳戶

AWS 免費方案提供可 25 GB 的儲存空間,以及每月可透過 Amazon DynamoDB 處理最多 2 億次請求。

查看 AWS 免費方案詳細資訊 »

Amazon Web Services (AWS) 為開發人員提供多種單欄式資料庫選項。您可以在 Amazon EC2Amazon EBS 雲端操作自己的非關聯式單欄資料存放區、與 AWS 解決方案供應商共同合作,或利用全受管單欄式資料庫服務。

Amazon Redshift 是欄導向的全受管 PB 級資料倉儲,可讓您使用現有的商業智慧工具,以簡單且經濟實惠的方式分析所有資料。Amazon Redshift 透過大規模平行處理、單欄式資料儲存體和極有效率的目標資料壓縮編碼機制的組合,實現了有效率的儲存和最佳查詢效能。進一步了解 Amazon Redshift »


開發人員可在 Amazon EC2Amazon EMR 安裝其偏好的欄導向資料庫,這表示開發人員不但可避免佈建基礎設施時產生的衝突,還能存取各種標準單欄式資料庫引擎。

Cassandra 是開放原始碼欄導向資料庫,可處理眾多商用伺服器的大量資料。與關聯式資料庫中的表格不同,相同表格中的不同列 (欄系列) 不需要共用相同的資料欄。

請參閱 A look inside Vidora's globally distributed, low-latency A.I. 中的 Multi-region Cassandra configuration。

執行 Cassandra 工作負載時可考慮搭配 EBS (了解 CrowdStrike 如何透過 EBS 執行密集且較便宜的 Cassandra 叢集)。如需使用 Cassandra 和在 AWS 執行 Cassandra 的更多資訊,請閱讀 AWS 上的 Apache Cassandra 白皮書並瀏覽 AWS Marketplace » 

Cassandra Topology in AWS
59:36
在 AWS 上執行 Apache Cassandra 的最佳實務

Apache HBase 是欄導向的開放原始碼分散式 NoSQL 資料庫。HBase 在 Apache Hadoop 框架上執行。HBase 為您提供一種可儲存大量疏鬆資料的容錯、高效率方法,此方法採用以欄為基礎的壓縮和儲存方式。

您可以在 Amazon Elastic Compute Cloud (Amazon EC2) 部署 HBase 並自行管理,或將 Apache HBase 做為 Amazon Elastic MapReduce (Amazon EMR) 上的受管服務使用。要進一步了解,請參閱 EMR Developer GuideAWS 大數據部落格的這篇文章 »