Una base de datos columnar está optimizada para leer y escribir columnas de datos en lugar de filas. El almacenamiento basado en columnas para las tablas de bases de datos es un factor importante en el desempeño de las consultas analíticas, ya que reduce notablemente los requisitos globales de E/S del disco, y reduce la cantidad de datos que hay que cargar desde el mismo.

De la misma forma que otras bases de datos NoSQL, las bases de datos columnares están diseñadas para reducir la escala utilizando clústeres distribuidos de hardware de bajo coste para aumentar el desempeño, de manera que resultan ideales para el almacenamiento de datos y el procesamiento de Big Data.

Comience con AWS de forma gratuita

Crear una cuenta gratuita

La capa gratuita de AWS ofrece 25 GB de almacenamiento, hasta 200 millones de solicitudes al mes con Amazon DynamoDB.

Consulte los detalles de la capa gratuita de AWS »

Amazon Web Services (AWS) proporciona una variedad de opciones de base de datos columnares para los desarrolladores. Puede operar su propio almacén de datos no relacional en columnas en la nube en Amazon EC2 y Amazon EBS, trabajar con proveedores de soluciones de AWS, o aprovechar los servicios de base de datos columnares totalmente gestionados.

Amazon Redshift es un almacén de datos orientado a columnas, rápido y totalmente administrado a escala de petabytes que permite analizar todos los datos de forma sencilla y rentable utilizando las herramientas de inteligencia empresarial existentes. Amazon Redshift consigue un almacenamiento eficiente y un rendimiento óptimo a través de una combinación de procesamiento paralelo de forma masiva, almacenamiento de datos en columnas y esquemas de codificación de compresión de datos muy específicos y eficientes. Más información sobre Amazon Redshift »


Los desarrolladores pueden instalar las bases de datos orientadas a columnas que elijan en Amazon EC2 y Amazon EMR, lo que significa que evitan la fricción del aprovisionamiento de la infraestructura, al tiempo que les permite acceder a diferentes motores de bases de datos columnares estándar.

Cassandra es una base de datos orientada a columnas de código abierto diseñada para gestionar grandes cantidades de datos en muchos servidores comerciales. A diferencia de una tabla en una base de datos relacional, las diferentes filas en la misma tabla (familia de columna) no tienen que compartir el mismo conjunto de columnas.

Consulte la configuración Cassandra multiregión con una mirada a la I.A. de baja latencia distribuida a nivel global de Vidora.

Considere EBS cuando ejecute cargas de trabajo de Cassandra (sepa cómo CrowdStrike ejecuta clústeres más económicos y densos de Cassandra con EBS). Para más información sobre cómo trabajar con Cassandra y ejecutar Cassandra en AWS, consulte el documento técnico Apache Cassandra on AWS y visite el AWS Marketplace » 

Cassandra Topology in AWS
59:36
Prácticas recomendadas para ejecutar Apache Cassandra en AWS

Apache HBase es una base de datos NoSQL distribuida de código abierto y orientada a columnas. Hbase se ejecuta en el marco Apache Hadoop. HBase ofrece una forma eficiente y a prueba de fallos para almacenar grandes cantidades de datos dispersos con almacenamiento y compresión basados en columnas.

Puede implementar HBase en Amazon Elastic Cloud Compute (Amazon EC2) y gestionarlo usted mismo o aprovechar Apache HBase como un servicio gestionado en Amazon Elastic MapReduce (Amazon EMR).Si desea más información, consulte la Guía para desarrolladores de EMR y esta publicación en el blog de big data de AWS »