Eine spaltenorientierte Datenbank ist zum Lesen und Schreiben von Datenspalten (anstatt Datenzeilen) optimiert. Spaltenorientierter Speicher für Datenbanktabellen ist bei der analytischen Abfrage ein wichtiger Faktor, da sich die E/A-Anforderungen von Festplatten dadurch insgesamt drastisch reduzieren. Auch die von der Festplatte zu ladende Datenmenge verringert sich.

Wie andere NoSQL-Datenbanken sind spaltenbasierte Datenbanken für die horizontale Skalierung durch verteilte, aus kostengünstiger Hardware bestehende Cluster konzipiert, um den Durchsatz zu steigern. Sie sind daher perfekt für Data Warehousing und die Big Data-Verarbeitung geeignet.

Kostenlos bei AWS einsteigen

Kostenloses Konto erstellen

Das kostenlose Nutzungskontingent für AWS bietet 25 GB Speicher und bis zu 200 Millionen Anfragen im Monat mit Amazon DynamoDB.

Details zum kostenlosen Kontingent für AWS anzeigen »

Amazon Web Services (AWS) bietet Entwicklern verschiedene Optionen für spaltenbasierte Datenbanken. Sie können Ihren eigenen nicht relationalen spaltenorientierten Datenspeicher in der Cloud in Amazon EC2 und Amazon EBS betreiben, mit Amazon-Lösungsanbietern kooperieren oder vollständig verwaltete Services für spaltenbasierte Datenbanken nutzen.

Amazon Redshift ist ein spaltenorientiertes, vollständig verwaltetes Data Warehouse für Datenmengen im Petabyte-Bereich, mit dem Sie im Zusammenspiel mit Ihren vorhandenen Business Intelligence-Tools alle Ihre Daten einfach und wirtschaftlich analysieren können. Amazon Redshift erreicht seine effiziente Speicherung und eine optimale Abfrageleistung durch eine Kombination aus massiver Parallelverarbeitung, einem spaltenorientierten Datenspeicher und sehr effizienten, zielgerichteten Kodierungstechniken für die Datenkomprimierung. Weitere Informationen zu Amazon Redshift »


In Amazon EC2 und Amazon EMR können Entwickler spaltenbasierte Datenbanken ihrer Wahl installieren. Dadurch umgehen sie den mit der Infrastrukturbereitstellung verbundenen Aufwand und erhalten dennoch Zugriff auf verschiedene spaltenorientierte Standarddatenbank-Engines.

Cassandra ist eine spaltenorientierte Open Source-Datenbank für die Verarbeitung großer Datenmengen auf einer großen Zahl an Standardservern. Im Gegensatz zu einer Tabelle einer relationalen Datenbank müssen verschiedene Zeilen derselben Tabelle (Spaltenfamilie) nicht unbedingt die gleichen Spalten verwenden.

Lesen Sie hierzu auch den Blog-Beitrag A look inside Vidora’s globally distributed, low-latency A.I., der eine mehrere Regionen umfassende Cassandra-Konfiguration beschreibt.

Ziehen Sie bei der Ausführung von Cassandra-Workloads die Verwendung von EBS in Betracht (erfahren Sie, wie CrowdStrike mithilfe von EBS dichte, kostengünstigere Cluster ausführen konnte). Wenn Sie mehr über das Arbeiten mit Cassandra und das Ausführen von Cassandra auf AWS erfahren möchten, lesen Sie das Whitepaper Apache Cassandra on AWS und besuchen Sie den AWS Marketplace » 

Cassandra Topology in AWS
59:36
Best Practices for Running Apache Cassandra on AWS

Apache HBase ist eine verteilte, spaltenorientierte Open Source-NoSQL-Datenbank. Ausgeführt wird HBase unter dem Apache Hadoop-Framework. HBase bietet eine fehlertolerante, effiziente Methode für die Speicherung großer Datenmengen mit geringer Dichte. Es setzt dazu spaltenorientierte Kompression und Speicherung ein.

Sie können Apache HBase in Amazon Elastic Cloud Compute (Amazon EC2) bereitstellen und selbst verwalten oder in Amazon Elastic MapReduce (Amazon EMR) als verwalteten Service nutzen. Lesen Sie hierzu auch das Handbuch EMR Developer Guide sowie diesen Beitrag im AWS Big Data Blog ».