Amazon Redshift é o data warehouse mais popular e rápido na nuvem. O Redshift é integrado ao seu data lake e oferece performance de preço até três vezes melhor do que qualquer outro data warehouse.

Recursos e benefícios

A cada ano, lançamos centenas de recursos e aprimoramentos de produtos baseados em casos de uso e feedback dos clientes. Saiba mais sobre as novidades.

Maior integração com data lakes e serviços da AWS

O Amazon Redshift permite que você trabalhe com seus dados em formatos abertos com simplicidade e rapidez e facilita a conexão e integração ao ecossistema da AWS.

Consulte e exporte dados de/para um data lake: nenhum outro data warehouse na nuvem facilita tanto a consulta e a gravação de dados em um data lake usando formatos abertos. Você pode consultar formatos de arquivos abertos como Parquet, ORC, JSON, Avro, CSV e outros formatos diretamente no S3 usando o ANSI SQL já conhecido. Para exportar dados para um data lake, basta usar o comando UNLOAD do Redshift no código SQL e especificar o Parquet como formato de arquivo. O Redshift formata e move automaticamente os dados para o S3. Assim, você conta com a flexibilidade de armazenar dados altamente estruturados e acessados com frequência em um data warehouse do Redshift. Além disso, você pode manter até exabytes de dados estruturados, semiestruturados e não estruturados no S3. A exportação de dados do Redshift de volta para o data lake permite análises adicionais dos dados usando serviços da AWS como Amazon Athena, Amazon EMR e Amazon SageMaker

Consulta federada: com o novo recurso de consulta federada no Redshift, você pode acessar bancos de dados relacionais em operação. Consulte dados ao vivo em um ou mais bancos de dados do Amazon RDS e do Aurora PostgreSQL e em prévia do RDS MySQL e Aurora MySQL para conseguir visibilidade instantânea de todas as operações empresariais sem precisar movimentar dados. Você pode associar dados de um data warehouse do Redshift, dados de um data lake e, agora, dados de armazenamentos operacionais para aprimorar a tomada de decisões impulsionada por dados. O Redshift oferece otimizações sofisticadas para reduzir o volume de dados transferidos pela rede, complementando-os com processamento de dados maciçamente paralelo para consultas de alta performance. Saiba mais.

Redshift ML: o Redshift ML facilita a criação, o treinamento e a implantação de modelos do Amazon SageMaker usando o SQL para analistas de dados e desenvolvedores de banco de dados. Com o Amazon Redshift ML, os clientes podem usar instruções do SQL para criar e treinar modelos do Amazon SageMaker nos dados deles no Amazon Redshift e, em seguida, usar esses modelos para previsões como detecção de rotatividade e pontuação de risco diretamente em consultas e relatórios. Consulte a documentação do Redshift para saber como começar. Saiba mais.  

Ecossistema analítico da AWS: a integração nativa com o ecossistema analítico da AWS facilita o processamento de fluxos de trabalho completos de análises de dados sem imprevistos. Por exemplo, o AWS Lake Formation é um serviço que facilita a configuração de um data lake seguro em dias. O AWS Glue pode extrair, transformar e carregar (ETL) dados no Redshift. O Amazon Kinesis Data Firehose é a maneira mais fácil de capturar, transformar e carregar dados de streaming no Redshift para análises praticamente em tempo real. Você pode usar o Amazon EMR para processar dados usando Hadoop/Spark e carregar a saída no Amazon Redshift para inteligência de negócios e análises. O Amazon QuickSight é o primeiro serviço de inteligência de negócios com definição de preço de pagamento por sessão que você pode usar para criar relatórios, visualizações e painéis com dados do Redshift. Você pode usar o Redshift para preparar os dados para executar cargas de trabalho de machine learning com o Amazon SageMaker. Para acelerar as migrações para o Amazon Redshift, você pode usar o AWS Schema Conversion Tool e o AWS Database Migration Service (DMS). Além disso, o Amazon Redshift é estreitamente integrado ao Amazon Key Management Service (KMS) e ao Amazon CloudWatch para fins de segurança, monitoramento e conformidade. Você também pode usar UDFs do Lambda para chamar uma função do Lambda de suas consultas SQL como se estivesse chamando uma Função definida pelo usuário no Redshift. Você pode gravar UDFs do Lambda para integrar com serviços de parceiros da AWS e acessar outros serviços populares da AWS, como o Amazon DynamoDB ou o Amazon SageMaker.

Integração do console do parceiro Redshift (visualização): você pode acelerar a integração de dados e criar valiosos insights de negócios em minutos, integrando-se com soluções de parceiros selecionados no console do Redshift. Com essas soluções, é possível reunir os dados de aplicações como Salesforce, Google Analytics, Facebook Ads, Slack, Jira, Splunk e Marketo no data warehouse do Amazon Redshift de maneira eficiente e simplificada. Também é possível juntar esses conjuntos de dados díspares e analisá-los juntos para produzir insights acionáveis.

Melhor performance

O Amazon Redshift oferece performance rápida e líder do setor com flexibilidade.

Instâncias RA3: as instâncias RA3 oferecem performance de preço três vezes melhor do que qualquer serviço de data warehouse na nuvem. Essas instâncias do Amazon Redshift maximizam a velocidade para workloads de alta performance que exigem grandes quantidades de capacidade computacional. Além disso, oferecem a flexibilidade de pagar separadamente por computação e armazenamento mediante a especificação do número de instâncias necessárias. Saiba mais.

AQUA (Advanced Query Accelerator) for Amazon Redshift: O AQUA é um novo cache distribuído e acelerado por hardware que permite fazer consultas do Redshift até dez vezes mais rápido que qualquer outro data warehouse na nuvem pelo aumento automático de certos tipos de consulta. O AQUA usa armazenamento de estado sólido de alta velocidade, FPGAs e AWS Nitro para agilizar as consultas que verificam, filtram e agregam grandes conjuntos de dados. O AQUA está incluído no tipo de instância Redshift RA3 sem nenhum custo adicional. Saiba mais.

Armazenamento eficiente e processamento de consultas com alta performance: o Amazon Redshift oferece uma performance rápida para consultas em conjuntos de dados com tamanho entre gigabytes e petabytes. O armazenamento colunar, a compactação de dados e os mapas de zona reduzem a quantidade de E/S necessária para realizar consultas. Juntamente com codificações padrão do setor, como LZO e Zstandard, o Amazon Redshift também oferece a AZ64, uma codificação de compactação específica para tipos de dados numéricos e de data/hora, proporcionando economia de armazenamento e otimização da performance das consultas.

Visualizações materializadas: as visualizações materializadas do Amazon Redshift permitem obter uma performance substancialmente mais rápida de consultas para cargas de trabalho analíticas iterativas ou previsíveis, como exibição em painéis e consultas de ferramentas de Business Intelligence (BI – Inteligência de negócios) e trabalhos de processamento de dados do tipo Extract, Load, Transform (ELT – Extração, carga e transformação). Você pode usar visualizações materializadas para armazenar e gerenciar facilmente os resultados pré-calculados de uma instrução SELECT que faça referência a uma ou mais tabelas, inclusive tabelas externas. As consultas subsequentes que fizerem referência a visualizações materializadas poderão ser executadas muito mais rápido com a reutilização dos resultados pré-calculados. O Amazon Redshift pode manter com eficiência as visualizações materializadas de forma incremental para continuar a proporcionar os benefícios de performance de baixa latência. Saiba mais

Machine learning para maximizar a taxa de transferência e a performance: os recursos avançados de machine learning no Amazon Redshift oferecem altos níveis de taxa de transferência e performances, mesmo com cargas de trabalho variáveis ou atividades simultâneas de usuários. O Amazon Redshift usa algoritmos sofisticados para prever e classificar as consultas recebidas com base em seus tempos de execução e requisitos de recursos para gerenciar dinamicamente a performance e a simultaneidade, além de ajudar a priorizar as cargas de trabalho empresariais críticas. A aceleração de consultas breves (SQA) envia consultas breves de aplicativos, como painéis, para uma fila expressa de processamento imediato, em vez de ficar aguardando a execução de consultas maiores. O gerenciamento automático de cargas de trabalho (WLM) usa machine learning para gerenciar dinamicamente a memória e a simultaneidade, o que ajuda a maximizar o throughput das consultas. Além disso, agora você pode definir facilmente a prioridade das consultas mais importantes, mesmo quando centenas de consultas são enviadas. O Amazon Redshift também é um sistema com autoaprendizagem que observa continuamente as cargas de trabalho do usuários, determinando oportunidades de aumentar a performance à medida que cresce a utilização, aplicando otimizações de forma transparente e fazendo recomendações por meio do Redshift Advisor quando uma ação de usuário explícita é necessária para aumentar ainda mais a performance do Amazon Redshift. 

Armazenamento de resultados em cache: o Amazon Redshift armazena resultados em cache para oferecer tempos de resposta inferiores a um segundo para consultas repetidas. Ferramentas de painel, visualização e inteligência de negócios que executam consultas repetidas obtêm um aumento significativo de performance. Quando uma consulta é executada, o Amazon Redshift pesquisa o cache para ver se existe um resultado armazenado de uma consulta anterior. Se um resultado em cache for encontrado e os dados não foram alterados, esse resultado será retornado imediatamente, em vez da execução de uma nova consulta.

Mais escalável

Se você escala dados ou usuários, o Amazon Redshift é praticamente ilimitado. 

Data warehousing na escala de petabytes: o Amazon Redshift é simples e escala rapidamente para acompanhar a evolução das necessidades. Com alguns cliques no console ou uma simples chamada de API, você pode alterar facilmente a quantidade ou o tipo dos nós em um data warehouse e aumentar ou diminuir a escala para acompanhar as mudanças das necessidades. O armazenamento gerenciado adiciona automaticamente capacidade para absorver workloads de até 8 PB de dados compactados. Saiba mais sobre o gerenciamento do cluster.

Análise de dados de data lakes na escala de petabytes: com o recurso Redshift Spectrum, você pode executar consultas em petabytes de dados no Amazon S3 sem precisar carregar ou transformar nenhum dado. Você pode usar o S3 como um data lake altamente disponível, seguro e econômico para armazenar dados ilimitados em formatos de dados abertos. O Amazon Redshift Spectrum executa consultas em milhares de nós paralelizados para fornecer resultados rápidos, independentemente da complexidade da consulta ou da quantidade de dados.  

Simultaneidade ilimitada: o Amazon Redshift oferece performance consistentemente rápida, mesmo com milhares de consultas simultâneas, tanto consultas de dados em um data warehouse do Amazon Redshift quanto as executadas diretamente em um data lake do Amazon S3. O dimensionamento de simultaneidade do Amazon Redshift oferece suporte a um número praticamente ilimitado de usuários e consultas simultâneas com níveis de serviço consistentes mediante a adição de capacidade temporária em segundos à medida que a simultaneidade aumenta. 

Compartilhamento de dados: o compartilhamento de dados do Amazon Redshift permite um modo seguro e fácil de dimensionar por meio do compartilhamento de dados em tempo real entre clusters do Redshift. O compartilhamento de dados melhora a agilidade das empresas, fornecendo acesso instantâneo, granular e de alta performance aos dados dentro de qualquer cluster do Redshift, sem a necessidade de copiá-lo ou movê-lo. Saiba mais.

Melhor valor

O uso do Amazon Redshift como data warehouse na nuvem oferece a flexibilidade de pagamento separado de computação e armazenamento, a habilidade de pausar e retomar o cluster, custos previsíveis com controles e opções para pagar conforme o uso ou economizar até 75% com um compromisso de instância reservada.

Opções flexíveis de definição de preço: além de ser o data warehouse mais econômico, o Amazon Redshift oferece opções para otimizar a forma de pagamento pelo data warehouse. Você pode começar aos poucos, pagando apenas 0,25 USD por hora, e escalar até 1.000 USD por terabyte por ano. O Amazon Redshift é o único data warehouse na nuvem que oferece definição de preço sob demanda sem custos antecipados, com uma definição de preço de instância reservada que pode gerar uma economia de até 75% com o compromisso de um período de vigência de 1 ou 3 anos, além de definição de preço por consulta, baseada na quantidade de dados verificados em um data lake do Amazon S3. A definição de preço do Amazon Redshift inclui segurança incorporada, compactação de dados, armazenamento de backup e transferência de dados. À medida que o volume de dados aumenta, você usa o armazenamento gerenciado das instâncias RA3 para armazenar dados de forma econômica, pagando 0,024 USD por GB por mês.

Custo previsível, mesmo com cargas de trabalho imprevisíveis: o Amazon Redshift permite que os clientes escalem com impacto mínimo sobre o custo, pois cada cluster ganha até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia. Esses créditos gratuitos são suficientes para as necessidades de simultaneidade de 97% dos clientes. Isso proporciona previsibilidade dos custos mensais, mesmo durante períodos de demanda analítica oscilante. 

Escolha o tipo de nó para obter o melhor valor para as cargas de trabalho: você pode selecionar entre três tipos de instância para otimizar o Amazon Redshift de acordo com as necessidades de data warehousing.

Os nós RA3 permitem escalar o armazenamento separadamente da computação. Com os nós RA3, você obtém um data warehouse de alta performance que armazena dados em uma camada de armazenamento separada. Basta dimensionar o data warehouse para a performance de consultas necessária.

Os nós Dense Compute (DC – Computação densa) permitem criar data warehouses de altíssima performance, usando CPUs rápidas, grandes quantidades de memória RAM e solid-state disks (SSDs – Discos de estado sólido) e são a melhor opção para um volume de dados inferior a 500 GB.

Os nós Dense Storage (DS2 – Armazenamento denso) permitem criar grandes data warehouses usando hard disk drives (HDDs – Unidades de disco rígido) por um preço reduzido na compra das instâncias reservadas de três anos. A maioria dos clientes que executam clusters DS2 pode migrar as workloads para clusters RA3 e conseguir uma performance duas vezes maior e mais armazenamento pelo mesmo custo do DS2.

Para alterar o dimensionamento do cluster ou alternar entre tipos de nó, basta uma única chamada de API ou alguns cliques no Console AWS. Acesse a página de definição de preço para mais informações.

Fácil de gerenciar

O Amazon Redshift automatiza tarefas de manutenção comuns para que você manter o foco nos insights de dados e não no data warehouse.

Provisionamento automatizado: o Amazon Redshift é simples de configurar e operar. Você pode implantar um novo data warehouse com apenas alguns cliques no Console AWS. O Amazon Redshift provisiona automaticamente a infraestrutura para você. A maioria das tarefas administrativas é automatizada, como backups e replicação. Quando você quiser assumir o controle, terá opções para ajudar a ajustar cargas de trabalho específicas. Novos recursos são lançados de forma transparente, eliminando a necessidade de agendar e aplicar atualizações e patches.

Backups automatizados: o backup dos dados do Amazon Redshift para o Amazon S3 é executado automaticamente. O Amazon Redshift pode replicar snapshots de forma assíncrona para o S3 em outra região para fins de recuperação de desastres. Você pode usar qualquer sistema ou snapshot de usuário para restaurar um cluster por meio do Console de Gerenciamento da AWS ou das APIs do Redshift. Seu cluster fica disponível assim que os metadados do sistema são restaurados e você pode começar a executar consultas enquanto os dados do usuário são processados em segundo plano.

Design de tabela automatizado: o Amazon Redshift monitora continuamente as workloads do usuário e usa algoritmos sofisticados para encontrar maneiras de melhorar o layout físico dos dados para otimizar as velocidades de consulta. A Otimização automática de tabela seleciona as melhores chaves de classificação e distribuição para otimizar a performance da workload do cluster. Se o Amazon Redshift determinar que a aplicação de uma chave melhorará a performance do cluster, as tabelas serão alteradas automaticamente, sem a necessidade de intervenção do administrador. Recursos adicionais, como Automatic Vacuum Delete, Automatic Table Sort e Automatic Analyze, eliminam a necessidade da manutenção manual e ajuste dos clusters do Redshift para conseguir a melhor performance para novos clusters e workloads de produção.  

Tolerante a falhas: há vários recursos que aprimoram a confiabilidade do cluster de data warehouse. Por exemplo, o Amazon Redshift monitora a integridade do cluster de maneira contínua, replica novamente de modo automático os dados de unidades com falha e substitui os nós conforme necessário para oferecer tolerância a falhas. Os clusters também podem ser realocados para Availability Zones (AZ – Zonas de disponibilidade) alternativas sem qualquer perda de dados ou alterações de aplicação.

Consultas flexíveis: o Amazon Redshift oferece a flexibilidade de executar consultas no console ou conectar ferramentas de cliente SQL, bibliotecas ou ferramentas de inteligência de negócios. O Editor de consultas no Console AWS oferece uma interface avançada para executar consultas SQL em clusters do Amazon Redshift e visualizar os resultados e o plano de execução da consulta (para aquelas executadas em nós de computação) adjacentes às suas consultas.

API simples para interagir com o Amazon Redshift: o Amazon Redshift permite acessar dados facilmente com todos os tipos de aplicações baseadas em serviços da web nativos da nuvem, conteinerizadas e sem servidor, assim como aplicações orientadas a eventos. A API Data do Amazon Redshift simplifica o acesso, a ingestão e a saída de dados por meio de linguagens e plataformas de programação compatíveis com o AWS SDK, como Python, Go, Java, Node.js, PHP, Ruby e C++. A API Data elimina a necessidade de configurar drivers e gerenciar conexões de banco de dados. Pelo contrário, você precisa executar comandos SQL para um cluster Amazon Redshift simplesmente chamando um endpoint da API protegido fornecido pela Data API. A Data API cuida do gerenciamento das conexões do banco de dados e do buffer dos dados. A Data API é assíncrona para que você possa recuperar seus resultados mais tarde. Os resultados da consulta são armazenados por 24 horas.

Suporte nativo para análises de dados avançadas: o Redshift aceita tipos de dados escalares padrão, como NUMBER, VARCHAR e DATETIME, e oferece suporte nativo para o seguinte processamento analítico avançado:

Processamento de dados espaciais: o Amazon Redshift oferece um tipo de dados polimórficos, GEOMETRY, que permite várias formas geométricas como Point, Linestring, Polygon etc. O Redshift também oferece funções espaciais de SQL para construir formas geométricas e importar, exportar, acessar e processar dados espaciais. Os clientes podem adicionar colunas GEOMETRY às tabelas do Redshift e criar consultas SQL abrangendo dados espaciais e não espaciais. Esse recurso permite que você armazene, recupere e processe dados espaciais e aprimore insights empresariais de maneira transparente, integrando dados espaciais a consultas analíticas. Como o Redshift permite consultar data lakes de modo transparente, os clientes também podem estender facilmente o processamento espacial para data lakes, integrando tabelas externas em consultas espaciais. Consulte a documentação para obter mais detalhes.

Sketches HyperLogLog: o HyperLogLog é um novo algoritmo que estima com eficiência o número aproximado de valores distintos em um conjunto de dados. O sketch HLL é uma construção que encapsula as informações sobre os valores distintos no conjunto de dados. Você pode usar sketches HLL para conseguir benefícios de performance significativos para consultas que calculam a cardinalidade aproximada em grandes conjuntos de dados, com um erro relativo médio entre 0,01 e 0,6%. O Redshift fornece um tipo de dados de primeira classe HLLSKETCH e funções SQL associadas para gerar, persistir e combinar sketches HyperLogLog. O recurso HyperLogLog do Amazon Redshift usa técnicas de correção de polarização e oferece alta precisão com baixo consumo de memória. Consulte a documentação para obter mais detalhes.

Tipos de dados DATE & TIME: o Amazon Redshift oferece vários tipos de dados DATE, TIME, TIMETZ, TIMESTAMP e TIMESTAMPTZ para armazenar e processar dados/dados de tempo de maneira nativa. Os tipos TIME e TIMESTAMP armazenam os dados de tempo sem informações de fuso horário, enquanto os tipos TIMETZ e TIMESTAMPTZ armazenam os dados de tempo incluindo as informações de fuso horário. Você pode usar diversas funções SQL de data/hora para processar os valores de data e hora em consultas do Redshift. Consulte a documentação para obter mais detalhes.

Processamento de dados semiestruturados: o tipo de dados SUPER do Amazon Redshift armazena de maneira nativa os dados JSON e outros dados semiestruturados em tabelas do Redshift e usa a linguagem de consulta PartiQL para processar facilmente os dados semiestruturados. O tipo de dados SUPER não tem esquema por natureza e permite o armazenamento de valores aninhados que podem conter valores escalares, matrizes aninhadas e estruturas aninhadas do Redshift. O PartiQL é uma extensão do SQL e fornece recursos de consulta poderosos, como navegação de objeto e matriz, desaninhamento de matrizes, tipagem dinâmica e semântica sem esquema. Isso permite conseguir análises de dados avançadas que combinam os dados SQL estruturados clássicos com os dados SUPER semiestruturados com performance superior, flexibilidade e facilidade de uso. Consulte a documentação para obter mais detalhes.

Integração com ferramentas de terceiros: há várias opções para aprimorar o Amazon Redshift por meio do trabalho com ferramentas e especialistas líderes do setor para carregar, transformar e visualizar dados. As soluções do nosso grande número de parceiros foram certificadas para trabalhar com o Amazon Redshift.

Mais segurança e conformidade

A AWS conta com recursos de segurança abrangentes para cumprir os requisitos mais rigorosos. O Amazon Redshift oferece segurança de dados pronta para uso sem custo adicional.

Criptografia de ponta a ponta: com apenas algumas configurações de parâmetro, é possível configurar o Amazon Redshift para usar SSL na proteção de dados em trânsito e criptografia AES-256 acelerada por hardware na proteção de dados ociosos. Se você optar por habilitar a criptografia de dados ociosos, todos os dados gravados em disco serão criptografados, assim como os backups. Por padrão, o Amazon Redshift cuida do gerenciamento de chaves.

Isolamento de rede: o Amazon Redshift permite que você configure regras de firewall para controlar o acesso de rede a um cluster de data warehouse. Você pode executar o Redshift dentro da Amazon Virtual Private Cloud (VPC) para isolar um cluster de data warehouse em sua própria rede virtual e conectá-lo à infraestrutura de TI existente usando uma VPN com IPsec criptografado padrão do setor.

Auditoria e conformidade: o Amazon Redshift é integrado ao AWS CloudTrail para possibilitar a auditoria de todas as chamadas de API do Redshift. O Redshift registra em log todas as operações de SQL, inclusive tentativas de conexão, consultas e alterações no data warehouse. Você pode acessar esses logs usando consultas SQL em tabelas do sistema ou optar por salvar os logs em um local seguro no Amazon S3. O Amazon Redshift está em conformidade com os requisitos de SOC1, SOC2, SOC3 e PCI DSS Nível 1. Para obter mais detalhes, consulte a conformidade da Nuvem AWS.

Tokenização: as user-defined function (UDFs – Funções definidas pelo usuário) do Amazon Lambda permitem que você use uma função do AWS Lambda como uma UDF no Amazon Redshift e a chame a partir das consultas SQL do Redshift. Essa funcionalidade permite que você grave extensões personalizadas para sua consulta SQL a fim de conseguir uma integração mais estreita com outros serviços ou produtos de terceiros. Você pode gravar UDFs do Lambda para permitir a tokenização externa, mascaramento dos dados, identificação ou não dos dados por meio da integração com revendedores como a Protegrity e para proteger ou não dados confidenciais com base nas permissões de um usuário e grupos na hora da consulta. 

Controles de acesso detalhados: os controles de segurança detalhados de linha e coluna garantem que os usuários vejam somente os dados aos quais têm acesso. O Amazon Redshift é integrado ao AWS Lake Formation, o que garante que os controles de acesso de coluna do Lake Formation também sejam aplicados às consultas do Redshift que acessam dados no data lake.

Saiba mais sobre as novidades.

Acesse a documentação do Amazon Redshift para obter informações mais detalhadas sobre o produto.

Saiba mais sobre a definição de preço do Amazon Redshift

Acesse a página de definição de preço
Pronto para criar?
Comece a usar o Amazon Redshift
Tem outras dúvidas?
Entre em contato conosco