O Amazon Redshift é o mais popular e rápido data warehouse na nuvem. O Redshift é integrado ao data lake, oferece uma performance até três vezes maior que qualquer outro data warehouse e custa até 75% menos que qualquer outro data warehouse em nuvem.

Recursos e benefícios

A cada ano, lançamos centenas de recursos e aprimoramentos de produtos baseados em casos de uso e feedback dos clientes. Saiba mais sobre as novidades.

Maior integração com data lakes e serviços da AWS

O Amazon Redshift permite que você trabalhe com seus dados em formatos abertos com simplicidade e rapidez e facilita a conexão ao ecossistema da AWS.

Consulte e exporte dados de/para um data lake: nenhum outro data warehouse na nuvem facilita tanto a consulta e a gravação de dados em um data lake usando formatos abertos. Você pode consultar formatos de arquivos abertos como Parquet, ORC, JSON, Avro, CSV e outros formatos diretamente no S3 usando o ANSI SQL já conhecido. Para exportar dados para um data lake, basta usar o comando UNLOAD do Redshift no código SQL e especificar o Parquet como formato de arquivo. O Redshift formata e move automaticamente os dados para o S3. Assim, você conta com a flexibilidade de armazenar dados altamente estruturados e acessados com frequência em um data warehouse do Redshift. Além disso, você pode manter até exabytes de dados estruturados, semiestruturados e não estruturados no S3. A exportação de dados do Redshift de volta para o data lake permite análises adicionais dos dados usando serviços da AWS como Amazon Athena, Amazon EMR e Amazon SageMaker

Consulta federada: com o novo recurso de consulta federada no Redshift, você pode acessar bancos de dados relacionais em operação. Consulte dados ao vivo em um ou mais bancos de dados do Amazon RDS e do Aurora PostgreSQL para obter visibilidade instantânea de todas operações empresariais sem precisar movimentar dados. Você pode associar dados de um data warehouse do Redshift, dados de um data lake e, agora, dados de armazenamentos operacionais para aprimorar a tomada de decisões baseadas em dados. O Redshift oferece otimizações sofisticadas para reduzir o volume de dados transferidos pela rede, complementando-os com processamento de dados maciçamente paralelo para consultas de alta performance. Saiba mais.

Ecossistema analítico da AWS: a integração nativa com o ecossistema analítico da AWS facilita o processamento de fluxos de trabalho completos de análises sem imprevistos. Por exemplo, o AWS Lake Formation é um serviço que facilita a configuração de um data lake seguro em dias. O AWS Glue pode extrair, transformar e carregar (ETL) dados no Redshift. O Amazon Kinesis Data Firehose é a maneira mais fácil de capturar, transformar e carregar dados de streaming no Redshift para análises praticamente em tempo real. Você pode usar o Amazon EMR para processar dados usando Hadoop/Spark e carregar a saída no Amazon Redshift para inteligência de negócios e análises. O Amazon QuickSight é o primeiro serviço de inteligência de negócios com definição de preço de pagamento por sessão que você pode usar para criar relatórios, visualizações e painéis com dados do Redshift. Você pode usar o Redshift para preparar os dados para executar cargas de trabalho de machine learning com o Amazon SageMaker. Para acelerar as migrações para o Amazon Redshift, você pode usar o AWS Schema Conversion Tool e o AWS Database Migration Service (DMS). Além disso, o Amazon Redshift é estreitamente integrado ao Amazon Key Management Service (KMS) e ao Amazon CloudWatch para fins de segurança, monitoramento e conformidade.

Melhor performance

O Amazon Redshift oferece performance rápida, líder do setor, com flexibilidade.

Instâncias RA3: as instâncias RA3 oferecem performance três vezes maior que qualquer serviço de data warehouse na nuvem. Essas instâncias do Amazon Redshift maximizam a velocidade para cargas de trabalho de alta performance que exigem grandes quantidades de capacidade computacional. Além disso, oferecem a flexibilidade de pagar separadamente por computação e armazenamento mediante a especificação do número de instâncias necessárias. Saiba mais.

Armazenamento eficiente e processamento de consultas com alta performance: o Amazon Redshift oferece uma performance rápida para consultas em conjuntos de dados com tamanho entre gigabytes e petabytes. O armazenamento colunar, a compactação de dados e os mapas de zona reduzem a quantidade de E/S necessária para realizar consultas. Juntamente com codificações padrão do setor, como LZO e Zstandard, o Amazon Redshift também oferece a AZ64, uma codificação de compactação específica para tipos de dados numéricos e de data/hora, proporcionando economia de armazenamento e otimização da performance das consultas.

Visualizações materializadas: as visualizações materializadas do Amazon Redshift permitem obter uma performance substancialmente mais rápida de consultas para cargas de trabalho analíticas, como exibição em painéis, consultas de ferramentas de inteligência de negócios (BI) e trabalhos de processamento de dados de extração, carga e transformação (ELT). Você pode usar visualizações materializadas para armazenar em cache resultados intermediários a fim de acelerar consultas de execução lenta. O Amazon Redshift pode manter com eficiência as visualizações materializadas de forma incremental para continuar a proporcionar os benefícios de performance de baixa latência. Saiba mais

Machine learning para maximizar o throughput e a performance: os recursos avançados de machine learning no Amazon Redshift oferecem altos níveis de throughput e performances, mesmo com cargas de trabalho variáveis ou atividades simultâneas de usuários. O Amazon Redshift usa algoritmos sofisticados para prever e classificar as consultas recebidas com base em seus tempos de execução e requisitos de recursos para gerenciar dinamicamente a performance e a simultaneidade, além de ajudar a priorizar as cargas de trabalho empresariais críticas. A aceleração de consultas breves (SQA) envia consultas breves de aplicativos, como painéis, para uma fila expressa de processamento imediato, em vez de ficar aguardando a execução de consultas maiores. O gerenciamento automático de cargas de trabalho (WLM) usa machine learning para gerenciar dinamicamente a memória e a simultaneidade, o que ajuda a maximizar o throughput das consultas. Além disso, agora você pode definir facilmente a prioridade das consultas mais importantes, mesmo quando centenas de consultas são enviadas. O Amazon Redshift também é um sistema com autoaprendizagem que observa continuamente as cargas de trabalho do usuários, determinando oportunidades de aumentar a performance à medida que cresce a utilização, aplicando otimizações de forma transparente e fazendo recomendações por meio do Redshift Advisor quando uma ação de usuário explícita é necessária para aumentar ainda mais a performance do Amazon Redshift. 

Armazenamento de resultados em cache: o Amazon Redshift armazena resultados em cache para oferecer tempos de resposta inferiores a um segundo para consultas repetidas. Ferramentas de painel, visualização e inteligência de negócios que executam consultas repetidas obtêm um aumento significativo de performance. Quando uma consulta é executada, o Amazon Redshift pesquisa o cache para ver se existe um resultado armazenado de uma consulta anterior. Se um resultado em cache for encontrado e os dados não foram alterados, esse resultado será retornado imediatamente, em vez da execução de uma nova consulta.

Mais escalável

Se você escala dados ou usuários, o Amazon Redshift é praticamente ilimitado. 

Data warehousing na escala de petabytes: o Amazon Redshift é simples e escala rapidamente para acompanhar a evolução das necessidades. Com alguns cliques no console ou uma simples chamada de API, você pode alterar facilmente a quantidade ou o tipo dos nós em um data warehouse e aumentar ou diminuir a escala para acompanhar as mudanças das necessidades. O armazenamento gerenciado adiciona automaticamente capacidade para absorver cargas de trabalho de até 8 PB de dados compactados. 

Análise de data lakes na escala de petabytes: com o recurso Redshift Spectrum, você pode executar consultas em petabytes de dados no Amazon S3 sem precisar carregar ou transformar nenhum dado. Você pode usar o S3 como um data lake altamente disponível, seguro e econômico para armazenar dados ilimitados em formatos de dados abertos. O Amazon Redshift Spectrum executa consultas em milhares de nós paralelizados para fornecer resultados rápidos, independentemente da complexidade da consulta ou da quantidade de dados.  

Simultaneidade ilimitada: o Amazon Redshift oferece performance consistentemente rápida, mesmo com milhares de consultas simultâneas, tanto consultas de dados em um data warehouse do Amazon Redshift quanto as executadas diretamente em um data lake do Amazon S3. A escalabilidade de simultaneidade do Amazon Redshift oferece suporte a um número praticamente ilimitado de usuários e consultas simultâneas com níveis de serviço consistentes mediante a adição de capacidade temporária em segundos à medida que a simultaneidade aumenta. 

Melhor valor

O uso do Amazon Redshift como data warehouse na nuvem oferece a flexibilidade de pagamento separado de computação e armazenamento, custos previsíveis com controles, e opções para pagar conforme o uso ou economizar até 75% com um compromisso de instância reservada.

Opções flexíveis de definição de preço: além de ser o data warehouse mais econômico, o Amazon Redshift oferece opções para otimizar a forma de pagamento pelo data warehouse. Você pode começar aos poucos, pagando apenas 0,25 USD por hora, e escalar até 1.000 USD por terabyte por ano. O Amazon Redshift é o único data warehouse na nuvem que oferece definição de preço sob demanda sem custos antecipados, com uma definição de preço de instância reservada que pode gerar uma economia de até 75% com o compromisso de um período de vigência de 1 ou 3 anos, além de definição de preço por consulta, baseada na quantidade de dados verificados em um data lake do Amazon S3. A definição de preço do Amazon Redshift inclui segurança incorporada, compactação de dados, armazenamento de backup e transferência de dados. À medida que o volume de dados aumenta, você usa o armazenamento gerenciado das instâncias RA3 para armazenar dados de forma econômica, pagando 0,024 USD por GB por mês.

Custo previsível, mesmo com cargas de trabalho imprevisíveis: o Amazon Redshift permite que os clientes escalem com impacto mínimo sobre o custo, pois cada cluster ganha até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia. Esses créditos gratuitos são suficientes para as necessidades de simultaneidade de 97% dos clientes. Isso proporciona previsibilidade dos custos mensais, mesmo durante períodos de demanda analítica oscilante. 

Escolha o tipo de nó para obter o melhor valor para as cargas de trabalho: você pode selecionar entre três tipos de instância para otimizar o Amazon Redshift de acordo com as necessidades de data warehousing.

Os nós RA3 permitem escalar o armazenamento separadamente da computação. Com os nós RA3, você obtém um data warehouse de alta performance que armazena dados em uma camada de armazenamento separada. Basta dimensionar o data warehouse para a performance de consultas necessária.

Os nós de computação densa (DC) permitem criar data warehouses de altíssima performance, usando CPUs rápidas, grandes quantidades de memória RAM e discos de estado sólido (SSDs), e são a melhor opção para um volume de dados inferior a 500 GB.

Os nós DS2 (armazenamento denso) permitem criar grandes data warehouses usando unidades de disco rígido (HDDs) por um preço reduzido na compra as instâncias reservadas de 3 anos. Esse é o tipo de nó mais econômico para armazenar cargas de trabalho pesadas. A maioria dos clientes que executam clusters de DS2 pode migrar as cargas de trabalho para clusters RA3 e obter uma performance duas vezes maior e mais armazenamento pelo mesmo custo do DS2.
Para alterar a escalabilidade do cluster ou alternar entre tipos de nó, basta uma única chamada de API ou alguns cliques no Console AWS. Acesse a página de definição de preço para mais informações.

Fácil de gerenciar

O Amazon Redshift automatiza tarefas de manutenção comuns para que você manter o foco nos insights de dados e não no data warehouse.

Provisionamento automatizado: o Amazon Redshift é simples de configurar e operar. Você pode implantar um novo data warehouse com apenas alguns cliques no Console AWS. O Amazon Redshift provisiona automaticamente a infraestrutura para você. A maioria das tarefas administrativas é automatizada, como backups e replicação. Quando você quiser assumir o controle, terá opções para ajudar a ajustar cargas de trabalho específicas. Novos recursos são lançados de forma transparente, eliminando a necessidade de agendar e aplicar atualizações e patches.

Backups automatizados: o backup dos dados do Amazon Redshift para o Amazon S3 é executado automaticamente. O Amazon Redshift pode replicar snapshots de forma assíncrona para o S3 em outra região para fins de recuperação de desastres. Você pode usar qualquer sistema ou snapshot de usuário para restaurar um cluster por meio do Console de Gerenciamento da AWS ou das APIs do Redshift. Seu cluster fica disponível assim que os metadados do sistema são restaurados e você pode começar a executar consultas enquanto os dados do usuário são processados em segundo plano.

Tolerante a falhas: há vários recursos que aprimoram a confiabilidade do cluster de data warehouse. Por exemplo, o Amazon Redshift monitora continuamente a integridade do cluster, replica novamente de forma automática os dados de unidades com falha e substitui os nós conforme necessário para oferecer tolerância a falhas.

Consultas flexíveis: o Amazon Redshift oferece a flexibilidade para executar consultas no console ou conectar ferramentas de cliente SQL, bibliotecas ou ferramentas de inteligência de negócios. O editor de consultas no Console AWS oferece uma interface avançada para executar consultas SQL em clusters do Amazon Redshift e visualizar os resultados da consulta e o plano de execução da consulta (para consultas executadas em nós de computação) adjacentes às suas consultas.

Processamento nativo de dados espaciais: o Amazon Redshift oferece suporte à funcionalidade de processamento nativo de dados espaciais. Esse recurso permite que os clientes armazenem, recuperem e processem dados espaciais e aprimorem de forma transparente insights empresariais, integrando dados espaciais a consultas analíticas. O Amazon Redshift oferece um tipo de dados polimórficos, GEOMETRY, que permite várias formas geométricas como Point, Linestring, Polygon etc. O Redshift também oferece funções espaciais de SQL para construir formas geométricas e importar, exportar, acessar e processar dados espaciais. Os clientes podem adicionar colunas GEOMETRY às tabelas do Redshift e criar consultas SQL abrangendo dados espaciais e não espaciais. Como o Redshift permite consultar data lakes de forma transparente, os clientes também podem estender facilmente o processamento espacial para data lakes, integrando tabelas externas em consultas espaciais.

Integração com ferramentas de terceiros: há várias opções para aprimorar o Amazon Redshift trabalhando com ferramentas e especialistas líderes do setor para carregar, transformar e visualizar dados. As soluções do nosso grande número de parceiros foram certificadas para trabalhar com o Amazon Redshift.

Mais segurança e conformidade

A AWS conta com recursos de segurança abrangentes para cumprir os requisitos mais rigorosos. O Amazon Redshift oferece segurança de dados pronta para uso sem custo adicional.

Criptografia de ponta a ponta: com apenas algumas configurações de parâmetro, é possível configurar o Amazon Redshift para usar SSL na proteção de dados em trânsito e criptografia AES-256 acelerada por hardware na proteção de dados ociosos. Se você optar por habilitar a criptografia de dados ociosos, todos os dados gravados em disco serão criptografados, assim como os backups. Por padrão, o Amazon Redshift cuida do gerenciamento de chaves.

Isolamento de rede: o Amazon Redshift permite que você configure regras de firewall para controlar o acesso de rede a um cluster de data warehouse. Você pode executar o Redshift dentro da Amazon Virtual Private Cloud (VPC) para isolar um cluster de data warehouse em sua própria rede virtual e conectá-lo à infraestrutura de TI existente usando uma VPN com IPsec criptografado padrão do setor.

Auditoria e conformidade: o Amazon Redshift é integrado ao AWS CloudTrail para possibilitar a auditoria de todas as chamadas de API do Redshift. O Redshift registra em log todas as operações de SQL, inclusive tentativas de conexão, consultas e alterações no data warehouse. Você pode acessar esses logs usando consultas SQL em tabelas do sistema ou optar por salvar os logs em um local seguro no Amazon S3. O Amazon Redshift está em conformidade com os requisitos de SOC1, SOC2, SOC3 e PCI DSS Nível 1. Para obter mais detalhes, consulte a conformidade da Nuvem AWS.

Controles de acesso detalhados: os controles de segurança detalhados de linha e coluna garantem que os usuários vejam somente os dados aos quais têm acesso. O Amazon Redshift é integrado ao AWS Lake Formation, o que garante que os controles de acesso de coluna do Lake Formation também sejam aplicados às consultas do Redshift que acessam dados no data lake.

Saiba mais sobre as novidades.

Acesse a documentação do Amazon Redshift para obter informações mais detalhadas sobre o produto.

Saiba mais sobre a definição de preço do Amazon Redshift

Acesse a página de definição de preço
Pronto para criar?
Comece a usar o Amazon Redshift
Tem outras dúvidas?
Entre em contato conosco