O Amazon Redshift estende as consultas de data warehouse a data lakes, sem necessidade de carregamento. Você pode executar consultas analíticas em meio a petabytes de dados armazenados localmente no Redshift, e diretamente, usando exabytes de dados armazenados no Amazon S3. O Redshift é simples de configurar e automatiza a maioria de suas tarefas administrativas, além de oferecer performance rápida em qualquer escala.

Principais recursos

Performance mais rápida

Massivamente paralelo: o Amazon Redshift oferece uma performance rápida para consultas em conjuntos de dados com tamanho entre gigabytes e exabytes. O Redshift usa armazenamento colunar, compactação de dados e mapas de zona para reduzir a quantidade de E/S necessária para realizar consultas. Ele usa uma arquitetura de data warehouse de processamento massivo paralelo (MPP) para paralelizar e distribuir operações SQL, aproveitando todos os recursos disponíveis. O hardware subjacente foi projetado para processamento de dados de alta performance, usando armazenamento conectado local para maximizar o throughput entre as CPUs e as unidades, e uma rede de malha de alta largura de banda para maximizar o throughput entre os nós.

Machine learning: o Amazon Redshift usa machine learning para oferecer alto throughput de acordo com as cargas de trabalho. O Redshift utiliza algoritmos sofisticados para prever os tempos de execução de consultas de entrada e os atribui à melhor fila para um processamento mais rápido. Por exemplo, consultas como painéis e relatórios com altos requisitos de simultaneidade são roteadas para uma fila expressa para processamento imediato.

Armazenamento de resultados em cache: o Amazon Redshift armazena resultados em cache para oferecer tempos de resposta inferiores a um segundo para consultas repetidas. Ferramentas de painel, visualização e inteligência de negócios que executam consultas repetidas têm um aumento significativo de performance. Quando uma consulta é executada, o Redshift pesquisa o cache para ver se existe um resultado armazenado de uma consulta anterior. Se um resultado em cache for encontrado e os dados não foram alterados, esse resultado será retornado imediatamente e uma nova consulta não será executada.

Fácil de configurar, implantar e gerenciar

Provisionamento automatizado: o Amazon Redshift é simples de configurar e operar. Você pode implantar um novo data warehouse com apenas alguns cliques no Console AWS. O Redshift provisiona automaticamente a infraestrutura para você. A maioria das tarefas administrativas é automatizada, como backups e replicação, para que você possa se concentrar nos dados em si, não na administração deles. Quando quiser tomar o controle, o Redshift fornece opções para ajudá-lo a fazer ajustes em suas cargas de trabalho específicas. Os novos recursos são lançados com muita clareza, eliminando a necessidade de agendar e aplicar atualizações e patches.

Backups automatizados: o Amazon Redshift faz backup automático e contínuo de dados para o Amazon S3. O Redshift pode replicar de forma assíncrona seus snapshots no S3 em outra região para recuperação de desastres. Você pode usar qualquer sistema ou snapshot de usuário para restaurar seu cluster usando o Console de Gerenciamento da AWS ou as APIs do Redshift. Seu cluster fica disponível assim que os metadados do sistema são restaurados e você pode começar a executar consultas enquanto os dados do usuário são colocados em segundo plano.

Tolerante a falhas: o Amazon Redshift tem vários recursos que aprimoram a confiabilidade do cluster de data warehouse. O Redshift monitora continuamente a integridade do cluster e replica novamente, automaticamente, os dados de unidades com falha, substituindo os nós conforme necessário para a tolerância a falhas.

Integração com ferramentas de terceiros: aprimore o Amazon Redshift trabalhando com ferramentas e especialistas líderes do setor para carregar, transformar e visualizar dados. As soluções do nosso grande número de parceiros foram certificadas para trabalhar com o Amazon Redshift. 

Econômico

Sem custos antecipados, pague conforme o uso: o Amazon Redshift é o data warehouse mais econômico e você paga apenas pelos recursos provisionados. Você pode começar aos poucos, pagando apenas 0,25 USD por hora, e escalar até 250 USD por terabyte por ano. O Redshift é o único data warehouse na nuvem que oferece definição de preço sob demanda sem custos antecipados, com uma definição de preço de instância reservada que pode gerar uma economia de até 75% com o compromisso de um período de vigência de 1 ou 3 anos, além de definição de preço por consulta, baseada na quantidade de dados verificados no seu data lake do Amazon S3. Para obter mais informações, acesse a página de definição de preço do Amazon Redshift.

Escolha o tipo de nó: você pode escolher entre dois tipos de nós para otimizar o Redshift de acordo com suas necessidades de data warehousing. Os nós de computação densa (DC) permitem criar data warehouses de altíssima performance, usando CPUs rápidas, grandes quantidades de memória RAM e discos de estado sólido (SSDs). Se você quiser escalar ou reduzir custos, poderá alternar para os tipos de nó de armazenamento denso (DS) mais econômicos que usam unidades de disco rígido maiores por um preço muito baixo. Para alterar a escalabilidade do cluster ou alternar entre tipos de nó, basta uma única chamada de API ou alguns cliques no console AWS.

Escale rapidamente para atender às suas necessidades

Data warehousing na escala de petabytes: o Amazon Redshift é simples e escala rapidamente para acompanhar a evolução das necessidades. Com alguns cliques no Console ou uma simples chamada de API, você pode alterar facilmente a quantidade ou o tipo dos nós em seu data warehouse, aumentando ou diminuindo conforme suas necessidades mudarem.

Análise de data lake na escala de petabytes: o Redshift Spectrum, um recurso do Redshift, permite que você execute consultas em exabytes de dados usando o Amazon S3 sem precisar carregar ou transformar nenhum dado. Você pode usar o S3 como um data lake altamente disponível, seguro e econômico para armazenar dados ilimitados em formatos de dados abertos.

Simultaneidade ilimitada: o Redshift Spectrum fornece simultaneidade ilimitada, permitindo que várias consultas acessem simultaneidade os mesmos dados no Amazon S3. O Redshift Spectrum executa consultas em milhares de nós paralelizados para fornecer resultados rápidos, independentemente da complexidade da consulta ou da quantidade de dados.

Consulte seu data lake

Data lake do Amazon S3: o Amazon Redshift é o único data warehouse que estende as consultas para o data lake do Amazon S3 sem carregar dados. Você pode consultar os formatos de arquivos de código aberto que você já usa, como Avro, CSV, Grok, JSON, ORC, Parquet e outros, diretamente no S3. Isso proporciona a flexibilidade de armazenar dados altamente estruturados e acessados com frequência em discos locais do Redshift, mantendo exabytes de dados estruturados e não estruturados no S3 e consultando de forma transparente em ambos para fornecer insights exclusivos que você não conseguiria de conjuntos de dados independentes.

Ecossistema de análise da AWS: o Amazon Redshift é integrado nativamente ao ecossistema de análises da AWS. O AWS Glue pode extrair, transformar e carregar dados (ETL) no Redshift. O Amazon Kinesis Data Firehose é a maneira mais fácil de capturar, transformar e carregar dados de streaming no Redshift para análises praticamente em tempo real. Você pode usar o Amazon QuickSight para criar relatórios, visualizações e painéis. Para acelerar a migração para o Amazon Redshift, você pode usar gratuitamente o AWS Database Migration Service (DMS) por seis meses. Saiba mais »

Seguro

Criptografia de ponta a ponta: com apenas algumas configurações de parâmetro, é possível configurar o Amazon Redshift para usar SSL na proteção de dados em trânsito e criptografia AES-256 acelerada por hardware para proteção de dados ociosos. Se você optar por habilitar a criptografia de dados ociosos, todos os dados gravados em disco serão criptografados, assim como os backups. Por padrão, o Amazon Redshift cuida do gerenciamento de chaves.

Isolamento de rede: o Amazon Redshift permite que você configure regras de firewall para controlar o acesso de rede a um cluster de data warehouse. Você pode executar o Amazon Redshift dentro da Amazon VPC para isolar seu cluster de data warehouse em sua própria rede virtual e conectá-lo à sua infraestrutura de TI atual usando VPN padrão do setor com IPsec criptografado.

Auditoria e conformidade: o Amazon Redshift integra-se com o AWS CloudTrail para possibilitar a auditoria de todas as chamadas de API do Redshift. O Redshift registra em log todas as operações de SQL, inclusive tentativas de conexão, consultas e alterações no banco de dados. Você pode acessar esses logs usando consultas SQL em tabelas do sistema ou optar por fazer o download dos registros para um local seguro no Amazon S3. O Amazon Redshift está em conformidade com os requisitos de SOC1, SOC2, SOC3 e PCI DSS Nível 1. Para obter mais detalhes, consulte a Conformidade da Nuvem AWS.

Saiba mais sobre a definição de preço do Amazon Redshift

Acesse a página de definição de preço
Pronto para criar?
Comece a usar o Amazon Redshift
Tem outras dúvidas?
Entre em contato conosco