Um banco de dados em colunas é otimizado para colunas de leitura e gravação, ao contrário das linhas de dados. O armazenamento em colunas para tabelas do banco de dados é um fator importante para a performance de consulta analítica, pois ele reduz expressivamente os requisitos gerais de E/S e diminui a quantidade de dados que você precisa carregar do disco.

Assim como outros bancos de dados NoSQL, os bancos de dados em colunas foram criados para aumentar a escala horizontal usando clusters distribuídos de hardware de baixo custo para aumentar o throughput, o que os torna ideais para data warehousing e processamento de big data.

Comece a usar a AWS gratuitamente

Crie uma conta gratuita

O nível gratuito da AWS oferece 25 GB de armazenamento e até 200 milhões de solicitações por mês com o Amazon DynamoDB.

Consulte os detalhes do nível gratuito da AWS »

A Amazon Web Services (AWS) disponibiliza várias opções de bancos de dados em colunas para desenvolvedores. É possível operar seu próprio datastore não relacional em colunas na nuvem no Amazon EC2 e no Amazon EBS, trabalhar com provedores de soluções da AWS ou usufruir dos serviços de bancos de dados em colunas totalmente gerenciados.

O Amazon Redshift é um data warehouse em colunas rápido, totalmente gerenciado e na escala de petabytes que torna simples e econômica a análise de todos os seus dados usando as ferramentas de inteligência de negócios de que você já dispõe. O Amazon Redshift obtém armazenamento eficiente e performance de consultas ideal por meio de uma combinação de processamento paralelo massivo, armazenamento de dados em colunas, bem como excelentes esquemas de codificação de compactação de dados direcionada. Saiba mais sobre o Amazon Redshift »


Os desenvolvedores podem instalar os bancos de dados em colunas de sua escolha no Amazon EC2 e no Amazon EMR, o que significa que eles evitam problemas de provisionamento da infraestrutura, além de obter acesso a vários mecanismos padrão de banco de dados em colunas.

O Cassandra é um banco de dados em colunas de código aberto projetado para processar grandes quantidades de dados em vários servidores básicos. Diferentemente de uma tabela em um banco de dados relacional, linhas diferentes na mesma tabela (famílias de colunas) não precisam compartilhar o mesmo conjunto de colunas.

Veja uma configuração multirregião do Cassandra ao analisar a inteligência artificial de baixa latência globalmente distribuída da Vidora

Considere o EBS ao executar cargas de trabalho do Cassandra (saiba como o CrowdStrike executa clusters densos e mais baratos do Cassandra com o EBS). Para obter mais informações sobre como trabalhar com o Cassandra e como executá-lo na AWS, leia o whitepaper Apache Cassandra on AWS e visite o AWS Marketplace » 

Cassandra Topology in AWS
59:36
Best Practices for Running Apache Cassandra on AWS

O Apache HBase é um banco de dados NoSQL em colunas de código aberto. O HBase é executado na estrutura do Apache Hadoop. O HBase oferece uma maneira eficiente e tolerante a falhas de armazenar grandes quantidades de dados esparsos usando compactação e armazenamento em colunas.

É possível implantar o HBase no Amazon Elastic Cloud Compute (Amazon EC2) e gerenciá-lo por conta própria ou utilizar o Apache HBase como um serviço gerenciado no Amazon Elastic MapReduce (Amazon EMR).  Saiba mais ao ler o Guia do desenvolvedor do EMR e esta publicação no blog sobre big data da AWS »