Nuvem AWS
Nuvem AWS
Iniciar o teste gratuito

O Amazon Redshift é um data warehouse rápido e gerenciado que torna simples e econômica a análise de todos os seus dados usando ferramentas SQL padrão, como também ferramentas de BI (Business intelligence – Inteligência de negócios) de que você já dispõe. Ele permite executar consultas complexas de análise em petabytes de dados estruturados, usando otimização de consulta avançada, armazenamento colunar em discos locais de alto desempenho e execução maciçamente paralela de consultas. A maioria dos resultados é disponibilizado em alguns segundos. Com o Amazon Redshift, você pode começar aos poucos, por apenas 0,25 USD por hora, sem compromissos, e aumentar a escala até petabytes de dados por 1.000 USD por terabyte ao ano, menos de um décimo do custo de soluções tradicionais.

O Amazon Redshift também inclui o Redshift Spectrum que permite executar diretamente consultas SQL em exabytes de dados não estruturados no Amazon S3. Não é preciso executar cargas ou transformações, e são permitidos formatos de dados abertos como Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile e TSV. O Redshift Spectrum escala automaticamente a capacidade computacional de consultas com base nos dados que estão sendo recuperados. Desta forma, as consultas no Amazon S3 são executadas de maneira rápida, independentemente do tamanho do conjunto de dados. Saiba mais sobre o Redshift Spectrum »

Para saber mais e bater papo com especialistas, participe do próximo Tech Talk: Serverless Analytics with Amazon Redshift Spectrum, AWS Glue, and Amazon QuickSight Inscreva-se agora>>

Performance rápida e uniforme

Rápido

O Amazon Redshift proporciona alto desempenho para consultas, usando tecnologia de armazenamento colunar para melhorar a eficiência de E/S e paralelizando consultas entre vários nós. A velocidade do carregamento de dados aumenta de forma linear com o tamanho do cluster, com integrações com o Amazon S3, o Amazon DynamoDB, o Amazon EMR, o Amazon Kinesis ou qualquer host compatível com SSH.

Altamente escalável

Baixo custo

Pague apenas pelo que usar. Você pode ter um número irrestrito de usuários fazendo análises ilimitadas em todos os seus dados por apenas 1.000 USD por terabyte ao ano, um décimo do custo das soluções de data warehouse tradicionais do mercado. A maioria dos clientes veem uma redução de três a quatro vezes maior no tamanho dos dados após a compactação, o que reduz os custos para um valor entre 250 USD e 333 USD por terabyte não compactado ao ano.

Performance rápida e uniforme

Extensível

Com o Redshift Spectrum, executar consultas em exabytes de dados no Amazon S3 é tão fácil quanto executar consultas em petabytes de dados armazenados em discos locais no Amazon Redshift, usando as mesmas ferramentas de BI e sintaxe SQL usadas atualmente. Você pode armazenar dados altamente estruturados acessados com frequência nos discos locais do Redshift, manter grandes quantidades de dados não estruturados em um "data lake" do Amazon S3 e executar consultas sem problemas nos dois serviços.

Flexível

Simples

O Amazon Redshift permite automatizar facilmente a maioria das tarefas administrativas para gerenciar, monitorar e escalar seu data warehouse. Ao processar todas essas tarefas demoradas e trabalhosas, o Amazon Redshift libera tempo para que você se concentre nos seus dados e na sua empresa.

Altamente escalável

Escalável

Você pode facilmente aumentar ou reduzir seu cluster, conforme as mudanças das suas necessidades de desempenho e capacidade, com apenas alguns cliques no console ou uma simples chamada de API.

Flexível

Seguro

A segurança é integrada. Você pode criptografar dados em repouso e em trânsito usando AES-256 e SSL acelerados por hardware, isolar clusters usando a Amazon VPC e até mesmo gerenciar suas chaves usando o AWS Key Management Service (KMS) e os módulos de segurança de hardware (HSMs).

Programação orientada por eventos

Compatível

O Amazon Redshift é compatível com SQL padrão e disponibiliza drivers personalizados JDBC e ODBC que você pode baixar por meio do console, permitindo o uso de uma grande variedade de clientes SQL conhecidos. Além disso, você pode usar drivers JDBC e ODBC padrão do PostgreSQL.

Otimizado para armazenamento de dados

O Amazon Redshift usa várias inovações para obter um desempenho de consulta muito elevado em conjuntos de dados com tamanhos que variam de centenas de gigabytes a um exabyte ou mais. Para dados locais na escala de petabytes, ele usa armazenamento colunar, compactação de dados e mapas de zona para reduzir a quantidade de E/S necessária para executar consultas. O Amazon Redshift tem uma arquitetura de data warehouse com processamento maciçamente paralelo (MPP), paralelizando e distribuindo operações SQL para usufruir de todos os recursos disponíveis. O hardware subjacente foi projetado para processamento de dados de alta performance, usando armazenamento conectado local para maximizar o throughput entre as CPUs e as unidades, e uma rede de malha de 10GigE para maximizar o throughput entre os nós. Para dados na escala de exabytes no Amazon S3, o Amazon Redshift gera um plano ideal de consulta que minimiza a quantidade de dados verificados. Além disso, ele delega a execução da consulta a um grupo de instâncias do Redshift Spectrum que ajusta a escala automaticamente para que as consultas sejam executadas de modo rápido, independentemente do tamanho dos dados.

Ajustar a escala de petabytes

Com apenas alguns cliques no console ou uma simples chamada de API, é possível alterar facilmente o número ou os tipos de nós no seu data warehouse e aumentar a escala vertical até atingir um petabyte ou mais de dados compactados de usuário. Os nós de armazenamento denso (DS) permitem criar armazéns de dados muito grandes usando discos rígidos (HDDs) por um preço bastante reduzido. Os nós de computação densa (DC) permitem criar armazéns de dados de altíssimo desempenho usando CPUs rápidas, grandes quantidades de memória RAM e discos de estado sólido (SSDs). Ao redimensionar, o Amazon Redshift permite que você continue a consultar seu data warehouse no modo somente leitura até que o novo cluster esteja totalmente provisionado e pronto para ser usado.

Consultar o "data lake" do Amazon S3

O Redshift Spectrum permite executar consultas em exabytes de dados não estruturados no Amazon S3, sem nenhum carregamento ou processamento de ETL exigido. Quando você emite uma consulta, ela é enviada para o endpoint SQL do Amazon Redshift, que cria e otimiza um plano de consulta. O Amazon Redshift determina quais dados são locais e o que consta no Amazon S3, cria um plano para minimizar a quantidade de dados do Amazon S3 que precisam ser lidos, solicita que operadores do Amazon Redshift Spectrum de um grupo de recursos compartilhados leiam e processsem os dados do Amazon S3 e, por fim, envia os resultados de volta para o cluster do Amazon Redshift para que sejam executados os processamentos restantes necessários.

Sem custos adiantados

Pague somente pela capacidade que usar. É possível escolher a definição de preço sob demanda sem custos iniciais ou compromissos em longo prazo, ou obter taxas com descontos significativos com a definição de preço de instância reservada. A definição de preço sob demanda parte de apenas 0,25 USD/hora por nó DC1.Large de 160 GB ou 0,85 USD/hora por nó DS2.XLarge de 2 TB. Com instâncias reservadas com pagamento antecipado parcial, é possível baixar seu preço efetivo para 0,10 USD/hora por nó DC1.Large (5.500 USD/TB/ano) ou 0,228 USD/hora por nó DS2.XLarge (999 USD/TB/ano). O valor das consultas do Redshift Spectrum é de 5 USD/TB verificado no S3. Para obter mais informações, consulte a página de definição de preço do Amazon Redshift.

Tolerância a falhas

O Amazon Redshift tem vários recursos que aprimoram a confiabilidade do seu cluster de data warehouse. Todos os dados gravados em um nó em seu cluster são automaticamente replicados para outros nós no cluster e é feito continuamente backup de todos os dados no Amazon S3. O Amazon Redshift monitora continuamente a saúde do cluster e automaticamente replica os dados de unidades com falha e substitui os nós conforme necessário.

Backups automatizados

O Amazon Redshift faz o backup de modo automático e contínuo de novos dados no Amazon S3. Ele armazena snapshots durante um período definido pelo usuário que varia entre 1 e 35 dias. Você pode criar seus próprios snapshots a qualquer momento e eles serão mantidos até que você os exclua explicitamente. O Amazon Redshift também pode replicar de forma assíncrona seus snapshots para o S3 em outra região para fins de recuperação de desastres. Após excluir um cluster, seus snapshots do sistema serão removidos, mas os snapshots do usuário continuarão disponíveis até você os excluir explicitamente.

Restaurações rápidas

Você pode usar qualquer sistema ou snapshot de usuário para restaurar seu cluster usando o Console de Gerenciamento da AWS ou as APIs do Amazon Redshift. Seu cluster fica disponível assim que os metadados do sistema são restaurados e você pode começar a executar consultas enquanto os dados do usuário são colocados no plano de fundo.

Criptografia

Com apenas algumas configurações de parâmetros, você pode configurar o Amazon Redshift para usar SSL para proteger dados em trânsito e criptografia AES-256 acelerada por hardware para os dados ociosos. Se você optar por ativar a criptografia de dados ociosos, todos os dados gravados em disco e todos os backups serão criptografados. Como padrão, o Amazon Redshift cuida do gerenciamento de chaves, mas você pode optar por gerenciar suas chaves usando seus próprios módulos de segurança de hardware (HSMs), o AWS CloudHSM ou o AWS Key Management Service.

Isolamento de rede

O Amazon Redshift permite configurar regras de firewall para controlar o acesso à rede para o seu cluster de armazém de dados. Você pode executar o Amazon Redshift dentro da Amazon VPC para isolar seu cluster de data warehouse em sua própria rede virtual e conectá-lo à sua infraestrutura de TI atual usando VPN padrão do setor com IPsec criptografado.

Auditoria e conformidade

O Amazon Redshift integra-se com o AWS CloudTrail para possibilitar a auditoria de todas as chamadas de API do Redshift. O Amazon Redshift também registra em log todas as operações de SQL, incluindo tentativas de conexão, consultas e alterações em seu banco de dados. Você pode acessar esses logs usando consultas SQL em tabelas do sistema ou optar por baixá-los em um local seguro no Amazon S3. O Amazon Redshift é compatível com os requisitos de SOC1, SOC2, SOC3 e PCI DSS Nível 1. Para obter mais detalhes, consulte a Conformidade da Nuvem AWS.

440x220_APN-Blog

O Amazon Redshift Spectrum permite estender a capacidade analítica do Amazon Redshift além dos dados armazenados em discos locais no seu data warehouse para consultar grandes quantidades de dados não estruturados no "data lake" do Amazon S3, sem necessidade de carregar ou transformar dados. Nesta publicação de blog, coletamos 10 melhores práticas importantes para o Amazon Redshift Spectrum, agrupando-as em diversos grupos funcionais diferentes.

Leia a publicação completa »

Com o Amazon Redshift Spectrum, clientes do Amazon Redshift podem consultar facilmente dados no Amazon S3. O Redshift Spectrum opera diretamente em dados de origem no formato nativo (incluindo Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile e TSV). Desse modo, nenhuma carga ou transformação de dados é necessária.

Leia a publicação completa »

Para permitir o processamento de dados como e onde estiverem, além de utilizar a capacidade e a flexibilidade do Amazon Redshift, estamos lançando o Amazon Redshift Spectrum. O Spectrum pode ser usado para executar consultas complexas de dados armazenados no Amazon Simple Storage Service (S3), sem a necessidade de carregamento nem qualquer outro tipo de preparação de dados.

Leia a publicação completa »

A compactação colunar é uma importante tecnologia no Amazon Redshift. Ela ajuda a reduzir os custos do cliente ao aumentar a capacidade efetiva de armazenamento dos nossos nós, além de melhorar a performance ao reduzir a E/S necessária para processar solicitações SQL. A melhoria da eficiência de E/S é um item muito importante para data warehousing. No ano passado, nossas melhorias de E/S dobraram o throughput de consultas. Vamos falar um pouco sobre as novas melhorias de compactação que adicionamos recentemente ao Amazon Redshift.

Leia a publicação completa »

Para obter uma lista completa das publicações de blog relacionadas ao Amazon Redshift, consulte a página de publicações de blog »

Teste o Amazon Redshift gratuitamente. Obtenha 750 horas de DC1.Large gratuitas por mês durante dois meses. Para começar o teste gratuito, crie uma conta da AWS e faça o login no Console do Amazon Redshift. Em seguida, lance um cluster do Amazon Redshift e selecione a opção DC1.Large para Node Type. Para solicitar auxílio para prova de conceito ou avaliação, clique aqui.

 

Comece a usar agora