Nuvem da AWS
Conceitos básicos do Amazon Redshift

Dados e análises se tornaram indispensáveis para que as empresas se mantenham competitivas. As empresas usam ferramentas de relatórios, painéis e análises para extrair insights dos dados, monitorar o desempenho dos negócios e apoiar a tomada de decisões. Essas ferramentas de relatórios, painéis e análises são baseadas em armazéns de dados, que armazenam dados com eficiência para minimizar a E/S e entregar resultados de consultas com rapidez incrível a centenas e milhares de usuários ao mesmo tempo.

Faça o download do whitepaper Enterprise Data Warehousing on AWS

O armazém de dados funciona como um repositório central de informações originadas em uma ou mais fontes de dados. Os dados fluem de sistemas transacionais e outros bancos de dados relacionais para o armazém de dados e consistem geralmente em dados estruturados, semiestruturados e não estruturados. Esses dados são processados, transformados e consumidos regularmente. Usuários como cientistas de dados, analistas de negócios e tomadores de decisão usam ferramentas de inteligência de negócios, clientes SQL e planilhas para acessar os dados processados no armazém de dados.

 

  Armazém de dados Banco de dados transacional
Cargas de trabalho adequadas Análises, big data Processamento de transações
Tipos de operações Otimizado para operações de gravação em lotes e leitura de grandes volumes de dados para reduzir a E/S e maximizar o throughput de dados Otimizado para operações de gravação contínua e grandes volumes de pequenas operações de leitura para maximizar o throughput de transações
Normalização de dados Usa schemas desnormalizados como Star e Snowflake Usa schemas altamente normalizados, mais adequados para requisitos de alto throughput de transações
Armazenamento Exige armazenamento em colunas ou outros tipos especializados de armazenamento Bancos de dados orientados a linhas que armazenam linhas inteiras em um bloco físico

A AWS permite aproveitar todos os benefícios essenciais associados à computação sob demanda, como acesso a capacidades praticamente ilimitadas de armazenamento e computação e a possibilidade de alterar a escala do sistema em paralelo ao crescimento do volume de dados coletados, armazenados e consultados. E você paga apenas pelos recursos provisionados. Além disso, a AWS oferece um amplo conjunto de recursos gerenciados integrados diretamente entre si, o que permite implantar rapidamente uma solução completa de análises e armazém de dados.

A ilustração a seguir mostra as principais etapas de uma cadeia completa de processos de análise e os serviços gerenciados disponíveis na AWS para cada etapa:

Pipeline de análises na AWS

O Amazon Redshift é uma solução de armazém de dados rápida, fácil de usar e totalmente gerenciada. Ele automatiza o provisionamento de infraestrutura e tarefas administrativas como backups, replicação e aplicação de patches. Além disso, ele se integra diretamente a ferramentas de BI e ETL de terceiros para que você possa obter o primeiro relatório em alguns minutos. E não há limite para a quantidade de dados que pode ser carregada e analisada. Conforme os dados crescem, você não precisa se preocupar com atualizações de sistema dispendiosas ou baixo desempenho. O Redshift é rápido em qualquer escala porque usa armazenamento em colunas e grande quantidade de otimizações. Além disso, o Amazon Redshift é econômico e você paga apenas pelo que usa. É possível ter um número ilimitado de usuários realizando análises ilimitadas em todos os dados por apenas 1.000 USD por terabyte por ano. Saiba mais