Une base de données orientée colonnes est optimisées pour lire et écrire des colonnes de données, et non pas des rangées. Le stockage orienté colonnes des tables de base de données est un facteur important pour les performances des requêtes analytiques. En effet, il réduit considérablement la charge E/S globale du disque et il limite les quantités de données à charger depuis le disque.

A l'instar des autres bases de données NoSQL, les bases de données orientées colonnes sont conçues pour se dimensionner en externe à l'aide de clusters distribués bâtis sur du matériel à bas prix afin d'augmenter le débit, ce qui les rend idéales pour l'entreposage de données et le traitement de Big Data.

Découvrez gratuitement AWS

Créez un compte gratuit

Dans le cadre du niveau gratuit AWS, bénéficiez de 25 Go de stockage et jusqu'à 200 millions de requêtes par mois avec Amazon DynamoDB.

Voir les détails relatifs au niveau gratuit d'AWS »

Amazon Web Services (AWS) fournit une large gamme d'options de bases de données orientée colonnes à destination des développeurs. Vous pouvez exploiter votre propre magasin de données non relationnelles orienté colonnes dans le cloud sur Amazon EC2 et Amazon EBS, travailler avec les fournisseurs de solutions Amazon ou tirer parti de services non relationnels entièrement gérés.

Amazon Redshift est un service d'entrepsage de données rapide, entièrement géré, orienté colonnes et doté d'une capacité de plusieurs pétaoctets. Il permet d'analyser de manière simple et rentable toutes vos données grâce à vos outils d'informatique décisionnelle existants. Amazon Redshift permet un stockage efficace et des performances de requête optimales via la combinaison d'un traitement hautement parallèle, d'un stockage des données en colonnes et des schémas d'encodage de compression des données ciblés et très efficaces. En savoir plus sur Amazon Redshift »


Les développeurs peuvent installer les bases de données orientées colonnes de leur choix sur Amazon EC2 et Amazon EMR, ce qui signifie que les développeurs évitent les préoccupations liées au provisionnement de l'infrastructure tout en ayant accès à une variété de moteurs de base de données orientées colonnes standard.

Cassandra est une base de données open source orientée colonnes, conçue pour traiter de grandes quantités de données sur de nombreux serveurs produit. Contrairement à une table de base de données relationnelle, différentes lignes dans la même table (famille de colonne) n'ont pas à partager le même ensemble de colonnes.

Découvrez une configuration Cassandra multi-régions avec un coup d'œil à l'intérieur de l'I.A. de Vidora, à faible latence et distribuée dans le monde entier, une faible latence M.S.

Vous devriez envisager d'utiliser EBS pendant l'exécution de charges de travail Cassandra (découvrez comment CrowdStrike a exécuté des clusters Cassandra denses et économiques avec EBS). Pour plus d'informations sur le travail avec Cassandra son exécution Cassandra sur AWS, consultez le livre blanc Apache Cassandra on AWS et rendez-vous sur AWS Marketplace » 

Cassandra Topology in AWS
59:36
Bonnes pratiques pour l'exécution d'Apache Cassandra sur AWS

Apache HBase est une base de données NoSQL distribuée, open-source et orientée colonnes. HBase fonctionne sur le framework Apache Hadoop. HBase offre un stockage de volumes importants de données dispersées tolérant aux pannes et efficace, qui utilise la compression et le stockage basés sur des colonnes.

Vous pouvez déployer HBase sur Amazon Elastic Cloud Compute (Amazon EC2) et le gérer vous-même ou exploiter Apache HBase en tant que service géré sur Amazon Elastic MapReduce (Amazon EMR).  Consultez le manuel EMR Developer Guide et ce billet sur le blog AWS Big Data » pour en savoir plus.