Dúvidas sobre os conceitos básicos do Amazon Redshift? Conecte-se com um especialista da AWS »
O Amazon Redshift acelera o tempo para obter insights com data warehousing em nuvem rápido, fácil e seguro em escala.
Recursos e benefícios
A cada ano, lançamos centenas de recursos e aprimoramentos de produtos baseados em casos de uso e feedback dos clientes. Saiba mais sobre as novidades.
Analise todos os seus dados
Obtenha insights integrados executando análises preditivas e em tempo real sobre dados complexos e escalonados em seus bancos de dados operacionais, data lakes, data warehouses e milhares de conjuntos de dados de terceiros.
Consulta federada: com o novo recurso de consulta federada no Amazon Redshift, você pode acessar bancos de dados relacionais em operação. Consulte dados ao vivo em um ou mais bancos de dados do Amazon Relational Database Service (RDS), Aurora PostgreSQL, RDS MySQL e Aurora MySQL para obter visibilidade instantânea de todas as operações comerciais sem exigir a movimentação de dados. Você pode juntar dados de seus armazéns de dados do Redshift, dados em seus data lakes e dados em seus armazenamentos operacionais para tomar melhores decisões baseadas em dados. O Amazon Redshift oferece otimizações para reduzir a movimentação de dados na rede e o complementa com seu processamento de dados massivamente paralelo para consultas de alta performance. Saiba mais.
Compartilhamento de dados: o compartilhamento de dados do Amazon Redshift permite estender a facilidade de uso, a performance e os benefícios de custo que o Amazon Redshift oferece em um único cluster para implantações de vários clusters, possibilitando ao mesmo tempo o compartilhamento de dados. O compartilhamento de dados possibilita acesso instantâneo, detalhado e rápido aos dados por meio dos clusters do Redshift sem a necessidade de copiar ou mover esses dados. O compartilhamento de dados fornece acesso em tempo real aos dados, para que os seus usuários sempre vejam as informações mais atualizadas e consistentes à medida que são atualizadas no data warehouse. É possível compartilhar com segurança os dados ao vivo com os clusters do Redshift em contas iguais ou diferentes e entre regiões da AWS. Saiba mais.
AWS Data Exchange for Amazon Redshift: consulte conjuntos de dados Amazon Redshift de seu próprio cluster do Redshift sem extrair, transformar e carregar ETL os dados. Você pode se inscrever em produtos de data warehouse em nuvem do Redshift no AWS Data Exchange. Assim que um provedor faz uma atualização, a mudança fica visível para os assinantes. Se você é um provedor de dados, o acesso é concedido automaticamente quando uma assinatura começa e revogado quando ela termina, as faturas são geradas automaticamente quando os pagamentos vencem e os pagamentos são coletados por meio da AWS. Você pode licenciar o acesso a arquivos simples, dados no Amazon Redshift e dados entregues por meio de APIs, tudo com uma única assinatura. Saiba mais.
Redshift ML: o Redshift ML facilita a criação, o treinamento e a implantação de modelos do Amazon SageMaker usando o SQL para analistas de dados, cientistas de dados, profissionais de BI e desenvolvedores. Com o Redshift ML, os clientes podem usar instruções do SQL para criar e treinar modelos do Amazon SageMaker nos dados no Amazon Redshift e, em seguida, usar esses modelos para previsões como detecção de rotatividade, previsões financeiras, personalização e pontuação de risco diretamente em consultas e relatórios. Saiba mais.
Integração do Amazon Redshift para Apache Spark: Esse recurso facilita a criação e a execução de aplicações Apache Spark em dados do Amazon Redshift, permitindo que os clientes abram o data warehouse para um conjunto mais amplo de análises e soluções de machine learning. Com a Integração do Amazon Redshift para Apache Spark, os desenvolvedores que usam análises da AWS e serviços de ML, como Amazon EMR, AWS Glue, Amazon Athena Spark e Amazon SageMaker, podem começar em segundos e criar sem esforço aplicações Apache Spark que leem e gravam em suas aplicações Amazon Redshift data warehouse sem comprometer a performance das aplicações ou a consistência transacional dos dados. A Integração do Amazon Redshift para Apache Spark também facilita o monitoramento e a solução de problemas de performance de aplicações Apache Spark ao usar com o Amazon Redshift.
Amazon Aurora Zero-ETL para Amazon Redshift: é uma integração sem código entre o Amazon Aurora e o Amazon Redshift que permite que os clientes do Amazon Aurora usem o Amazon Redshift para análise quase em tempo real e machine learning em petabytes de dados transacionais. Segundos depois de os dados transacionais serem gravados no Amazon Aurora, o Amazon Aurora Zero-ETL para o Amazon Redshift disponibiliza os dados no Amazon Redshift, eliminando a necessidade de os clientes criarem e manterem pipelines de dados complexos executando operações de extração, transformação e carregamento (ETL). Essa integração reduz a carga e o custo operacional e permite que os clientes se concentrem na melhoria das suas aplicações. Com acesso quase em tempo real aos dados transacionais, os clientes podem aproveitar os recursos analíticos e de machine learning do Amazon Redshift para obter insights de dados transacionais e outros para responder com eficiência a eventos críticos e sensíveis ao tempo.
Ingestão de streaming: Engenheiros de dados, analistas de dados e desenvolvedores de big data estão usando mecanismos de streaming em tempo real para melhorar a capacidade de resposta do cliente. Com o novo recurso de ingestão de streaming no Amazon Redshift, você pode usar SQL (Structured Query Language) para se conectar e ingerir dados diretamente do Amazon Kinesis Data Streams e do Amazon Managed Streaming for Apache Kafka (MSK). O Amazon Redshift Streaming Ingestion também facilita a criação e o gerenciamento de pipelines downstream, permitindo que você crie visualizações materializadas diretamente nos streams. As visualizações materializadas também podem incluir transformações de SQL como parte do seu pipeline ELT (extração, transformação e carregamento). Você pode atualizar manualmente as visualizações materializadas definidas para consultar os dados de streaming mais recentes. Essa abordagem permite que você realize o processamento posterior e as transformações de dados de streaming usando ferramentas familiares existentes, sem custo adicional.
Consulte e exporte dados de/para um data lake: nenhum outro data warehouse na nuvem facilita tanto a consulta e a gravação de dados em um data lake usando formatos abertos. Você pode consultar formatos de arquivo abertos, como Parquet, ORC, JSON, Avro, CSV e outros, diretamente no Amazon S3 usando o conhecido ANSI SQL. Para exportar dados para um data lake, basta usar o comando UNLOAD do Amazon Redshift no código SQL e especificar o Parquet como formato de arquivo. O Amazon Redshift formata e move automaticamente os dados para o S3. Assim, você conta com a flexibilidade de armazenar dados altamente estruturados e acessados com frequência e dados semiestruturados em um data warehouse do Amazon Redshift. Além disso, você pode manter até exabytes de dados estruturados, semiestruturados e não estruturados no Amazon S3. A exportação de dados do Amazon Redshift de volta para o data lake permite análises adicionais dos dados usando serviços da AWS como Amazon Athena, Amazon EMR e Amazon SageMaker.
Integração com serviços da AWS: a integração nativa com serviços AWS, banco de dados e serviços de machine learning torna mais fácil lidar com fluxos de trabalho analíticos completos sem atrito. Por exemplo, o AWS Lake Formation é um serviço que facilita a configuração de um data lake seguro em dias. O AWS Glue pode extrair, transformar e carregar (ETL) dados no Amazon Redshift. O Amazon Kinesis Data Firehose é a maneira mais fácil de capturar, transformar e carregar dados de transmissão no Amazon Redshift para análises praticamente em tempo real. Você pode usar o Amazon EMR para processar dados usando Hadoop/Spark e carregar a saída no Amazon Redshift para inteligência de negócios e análises. O Amazon QuickSight é o primeiro serviço de inteligência de negócios com preço de pagamento por sessão que você pode usar para criar relatórios, visualizações e painéis com dados do Redshift. Você pode usar o Amazon Redshift para preparar os dados para executar workloads de machine learning (ML) com o Amazon SageMaker. Para acelerar as migrações para o Amazon Redshift, você pode usar o AWS Schema Conversion Tool e o AWS Database Migration Service (DMS). Além disso, o Amazon Redshift é estreitamente integrado ao Amazon Key Management Service (KMS) e ao Amazon CloudWatch para fins de segurança, monitoramento e conformidade. Você também pode usar User-Defined Functions (UDFs – Funções definidas pelo usuários) do Lambda para chamar uma função do Lambda de suas consultas SQL como se estivesse chamando uma UDF no Amazon Redshift. Você pode gravar UDFs do Lambda para integrar com serviços de parceiros da AWS e para acessar outros serviços populares da AWS, como o Amazon DynamoDB e o Amazon SageMaker.
Integração do console do parceiro: você pode acelerar a integração de dados e criar valiosos insights de negócios em minutos integrando-se com soluções de parceiros selecionados no console do Amazon Redshift. Com essas soluções, é possível reunir os dados de aplicações como Salesforce, Google Analytics, Facebook Ads, Slack, Jira, Splunk e Marketo no data warehouse do Redshift de maneira eficiente e simplificada. Isso também permite juntar esses conjuntos de dados díspares e analisá-los juntos para produzir insights acionáveis.
Cópia automática do Amazon S3: o Amazon Redshift oferece suporte à cópia automática para simplificar e automatizar o carregamento de dados do Amazon S3, reduzindo o tempo e o esforço para criar soluções personalizadas ou gerenciar serviços de terceiros. Com esse recurso, o Amazon Redshift elimina a necessidade de executar procedimentos de cópia manual e repetidamente, automatizando a ingestão de arquivos e cuidando das etapas contínuas de carregamento de dados. O suporte à cópia automática facilita que usuários da linha de negócios e analistas de dados sem nenhum conhecimento de engenharia de dados criem facilmente regras de ingestão e configurem a localização dos dados que desejam carregar do Amazon S3. À medida que novos dados chegam às pastas específicas do Amazon S3, o processo de ingestão é acionado automaticamente com base nas configurações definidas pelo usuário. Todos os formatos de arquivo são compatíveis com o comando de cópia do Redshift, incluindo CSV, JSON, Parquet e Avro.
Suporte nativo para análises de dados avançadas: o Amazon Redshift aceita tipos de dados escalares padrão, como NUMBER, VARCHAR e DATETIME, e oferece suporte nativo para o seguinte processamento analítico avançado:
- Processamento de dados espaciais: o Amazon Redshift oferece um tipo de dado polimórfico, GEOMETRY, que permite várias formas geométricas, como ponto, tracejado e polígono. O Amazon Redshift também oferece funções espaciais de SQL para construir formas geométricas e importar, exportar, acessar e processar dados espaciais. Os clientes podem adicionar colunas GEOMETRY às tabelas do Redshift e criar consultas SQL abrangendo dados espaciais e não espaciais. Esse recurso permite que você armazene, recupere e processe dados espaciais e aprimore insights empresariais de maneira transparente, integrando dados espaciais a consultas analíticas. Como o Amazon Redshift permite consultar data lakes de modo transparente, os clientes também podem estender facilmente o processamento espacial para data lakes, integrando tabelas externas em consultas espaciais. Consulte a documentação para obter mais detalhes.
- Sketches HyperLogLog: o HyperLogLog é um novo algoritmo que estima com eficiência o número aproximado de valores distintos em um conjunto de dados. O sketch HLL é uma construção que encapsula as informações sobre os valores distintos no conjunto de dados. Você pode usar sketches HLL para conseguir benefícios de performance significativos para consultas que calculam a cardinalidade aproximada em grandes conjuntos de dados, com um erro relativo médio de 0,01 a 0,6%. O Amazon Redshift fornece um tipo de dados de primeira classe HLLSKETCH e funções SQL associadas para gerar, persistir e combinar sketches HyperLogLog. A capacidade HyperLogLog do Amazon Redshift usa técnicas de correção de polarização e oferece alta precisão com baixo consumo de memória. Consulte a documentação para obter mais detalhes.
- Tipos de dado DATE & TIME: o Amazon Redshift oferece vários tipos de dado DATE, TIME, TIMETZ, TIMESTAMP e TIMESTAMPTZ para armazenar e processar dados/dados de tempo de maneira nativa. Os tipos TIME e TIMESTAMP armazenam os dados de tempo sem informações de fuso horário, enquanto os tipos TIMETZ e TIMESTAMPTZ armazenam os dados de tempo incluindo as informações de fuso horário. Você pode usar diversas funções SQL de data/hora para processar os valores de data e hora em consultas do Redshift. Consulte a documentação para obter mais detalhes.
- Processamento de dados semiestruturados: o tipo de dado SUPER do Amazon Redshift armazena de maneira nativa os dados JSON e outros dados semiestruturados em tabelas do Redshift e usa a linguagem de consulta PartiQL para processar facilmente os dados semiestruturados. O tipo de dado SUPER não tem esquema por natureza e permite o armazenamento de valores aninhados que podem conter valores escalares, matrizes aninhadas e estruturas aninhadas do Redshift. O PartiQL é uma extensão do SQL e fornece recursos de consulta poderosos, como navegação de objeto e matriz, desaninhamento de matrizes, tipagem dinâmica e semântica sem esquema. Isso permite conseguir análises de dados avançadas que combinam os dados SQL estruturados clássicos com os dados SUPER semiestruturados com performance superior, flexibilidade e facilidade de uso. Consulte a documentação para obter mais detalhes.
- Integração com ferramentas de terceiros: há várias opções para aprimorar o Amazon Redshift por meio do trabalho com ferramentas e especialistas líderes do setor para carregar, transformar e visualizar dados. As soluções do nosso grande número de parceiros foram certificadas para trabalhar com o Amazon Redshift.
- Carregue e transforme dados com os parceiros de integração de dados.
- Analise dados e compartilhe insights em toda a organização com os parceiros de business intelligence.
- Crie e implemente uma plataforma de dados analíticos com os parceiros de consultoria e integração de sistemas.
- Consulte, explore e modele dados usando ferramentas e utilitários de parceiros de consulta e modelagem de dados.
Performance de preço em qualquer escala
Obtenha uma performance de preço até 5 vezes melhor do que outros data warehouses em nuvem com otimizações automatizadas para melhorar a velocidade das consultas.
Instâncias RA3: as instâncias RA3 oferecem até 5x melhor performance de preço de qualquer serviço de data warehouse na nuvem. Essas instâncias do Amazon Redshift maximizam a velocidade para workloads de alta performance que exigem grandes quantidades de capacidade computacional. Além disso, oferecem a flexibilidade de pagar separadamente por computação e armazenamento mediante a especificação do número de instâncias necessárias. Saiba mais.
Armazenamento eficiente e processamento de consultas com alta performance: o Amazon Redshift oferece uma performance rápida para consultas em conjuntos de dados com tamanho entre gigabytes e petabytes. O armazenamento colunar, a compactação de dados e os mapas de zona reduzem a quantidade de E/S necessária para realizar consultas. Junto de codificações padrão do setor, como LZO e Zstandard, o Amazon Redshift também oferece a AZ64, uma codificação de compactação específica para tipos de dados numéricos e de data/hora, proporcionando economia de armazenamento e otimização da performance das consultas.
Simultaneidade ilimitada: o Amazon Redshift oferece performance consistentemente rápida, mesmo com milhares de consultas simultâneas, tanto consultas de dados em um data warehouse do Redshift quanto as executadas diretamente em um data lake do Amazon S3. A escalabilidade de simultaneidade do Amazon Redshift é compatível com um número praticamente ilimitado de usuários e com consultas simultâneas com níveis de serviço consistentes mediante a adição de capacidade temporária em segundos à medida que a simultaneidade aumenta. Saiba mais.
Visualizações materializadas: as visualizações materializadas do Amazon Redshift permitem obter uma performance substancialmente mais rápida de consultas para workloads analíticas iterativas ou previsíveis, como exibição em painéis e consultas de ferramentas de Business Intelligence (BI – Inteligência de negócios) e trabalhos de processamento de dados do tipo Extract, Load, Transform (ELT – Extração, carga e transformação). Você pode usar visualizações materializadas para armazenar e gerenciar facilmente os resultados pré-calculados de uma instrução SELECT que faça referência a uma ou mais tabelas, inclusive tabelas externas. As consultas subsequentes que fizerem referência a visualizações materializadas poderão ser executadas muito mais rápido com a reutilização dos resultados pré-calculados. O Amazon Redshift pode manter com eficiência as visualizações materializadas de forma incremental para continuar a proporcionar os benefícios de performance de baixa latência. Saiba mais.
Visualizações materializadas automatizadas: as organizações estão criando cada vez mais aplicações, painéis, relatórios e consultas ad-hoc dependentes de dados. Cada aplicação precisa ser ajustada e otimizada, o que requer tempo, recursos e dinheiro. As visualizações materializadas são uma ferramenta avançada para melhorar a performance das consultas. Para configurá-las, é preciso ter um bom entendimento das workloads. No entanto, você pode ter workloads que aumentam ou são alteradas. Nesses casos, os padrões de consulta não são previsíveis. As visualizações materializadas automatizadas melhoram o throughput de consultas, reduzem a latência de consultas, diminuem o tempo de execução por meio de uma atualização automática, reescrita automática de consultas, atualização incremental e monitoramento contínuo de clusters do Amazon Redshift. O Amazon Redshift equilibra a criação e o gerenciamento de AutoMVs com a utilização mínima de recursos. Saiba mais.
Machine learning para maximizar a throughput e a performance: os recursos avançados de ML no Amazon Redshift oferecem altos níveis de throughput e performances, mesmo com workloads variáveis ou atividades simultâneas de usuários. O Amazon Redshift usa algoritmos sofisticados para prever e classificar as consultas recebidas com base em seus tempos de execução e requisitos de recursos para gerenciar dinamicamente a performance e a simultaneidade, além de ajudar a priorizar as workloads empresariais essenciais. A aceleração de consultas breves (SQA) envia consultas breves de aplicações, como painéis, para uma fila expressa de processamento imediato, em vez de ficar aguardando a execução de consultas maiores. O gerenciamento automático de workloads (WLM) usa ML para gerenciar dinamicamente a memória e a simultaneidade, o que ajuda a maximizar a taxa de transferência das consultas. Além disso, agora você pode definir facilmente a prioridade das consultas mais importantes, mesmo quando centenas de consultas são enviadas. O Amazon Redshift também é um sistema com autoaprendizagem que observa as workloads do usuários, determinando oportunidades de aumentar a performance à medida que cresce a utilização, aplicando otimizações de forma transparente e fazendo recomendações por meio do Redshift Advisor quando uma ação de usuário explícita é necessária para aumentar ainda mais a performance do Redshift.
Armazenamento de resultados em cache: o Amazon Redshift armazena resultados em cache para oferecer tempos de resposta inferiores a um segundo para consultas repetidas. Ferramentas de painel, visualização e business intelligence que executam consultas repetidas obtêm um aumento significativo de performance. Quando uma consulta é executada, o Amazon Redshift pesquisa o cache para ver se existe um resultado armazenado de uma consulta anterior. Se um resultado em cache for encontrado e os dados não foram alterados, esse resultado será retornado imediatamente, em vez da execução de uma nova consulta.
Data warehousing em escala de petabytes: com alguns cliques no console ou uma simples chamada de API, você pode alterar facilmente a quantidade ou o tipo dos nós em um data warehouse e aumentar ou diminuir a escala para acompanhar as mudanças das necessidades. O armazenamento gerenciado adiciona automaticamente capacidade para absorver workloads de até 8 PB de dados compactados. Com o recurso Amazon Redshift Spectrum, você também pode executar consultas em petabytes de dados no Amazon S3 sem precisar carregar ou transformar nenhum dado. Você pode usar o S3 como um data lake altamente disponível, seguro e econômico para armazenar dados ilimitados em formatos de dados abertos. O Redshift Spectrum executa consultas em milhares de nós paralelizados para fornecer resultados rápidos, independentemente da complexidade da consulta ou da quantidade de dados.
Opções flexíveis de preço: além de ser o data warehouse mais econômico, o Amazon Redshift oferece opções para otimizar a forma de pagamento. Você pode começar aos poucos, pagando apenas 0,25 USD por hora, sem compromissos, e aumentar a escala até 1.000 USD por terabyte por ano. O Amazon Redshift é o único data warehouse na nuvem que oferece preços sob demanda sem custos antecipados, com preço de instância reservada que pode gerar uma economia de até 75% com o compromisso de um período de vigência de um ou três anos, além de preço por consulta baseado na quantidade de dados verificados em um data lake do Amazon S3. O preço do Amazon Redshift inclui segurança incorporada, compactação de dados, armazenamento de backup e transferência de dados. À medida que o volume de dados aumenta, você usa o armazenamento gerenciado das instâncias RA3 para armazenar dados de forma econômica, pagando 0,024 USD por GB por mês.
Custo previsível, mesmo com workloads imprevisíveis: o Amazon Redshift permite escalar com impacto mínimo sobre o custo, pois cada cluster ganha até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia. Esses créditos gratuitos são suficientes para as necessidades de simultaneidade de 97% dos clientes. Isso proporciona previsibilidade dos custos mensais, mesmo durante períodos de demanda analítica oscilante.
Escolha o tipo de nó para obter o melhor valor para as workloads: você pode selecionar entre três tipos de instância para otimizar o Amazon Redshift de acordo com as necessidades de data warehousing: nós RA3, nós Dense Compute e nós Dense Storage.
Os nós RA3 permitem escalar o armazenamento separadamente da computação. Com os nós RA3, você obtém um data warehouse de alta performance que armazena dados em uma camada de armazenamento separada. Basta dimensionar o data warehouse para a performance de consultas necessária.
Os nós Dense Compute (DC – Computação densa) permitem criar data warehouses de altíssima performance usando CPUs rápidas, grandes quantidades de memória RAM e solid-state disks (SSDs – Discos de estado sólido) e são a melhor opção para um volume de dados inferior a 500 GB.
Os nós Dense Storage (DS2 – Armazenamento denso) permitem criar grandes data warehouses usando hard disk drives (HDDs – Unidades de disco rígido) por um preço reduzido na compra das instâncias reservadas de três anos. A maioria dos clientes que executam clusters DS2 pode migrar as workloads para clusters RA3 e conseguir uma performance duas vezes maior e mais armazenamento pelo mesmo custo do DS2.
Para alterar a escalabilidade do cluster ou alternar entre tipos de nó, basta uma única chamada de API ou alguns cliques no Console de Gerenciamento da AWS. Acesse a página de preço para mais informações.
Fácil, seguro e confiável
Concentre-se em obter dados para insights em segundos e em entregar resultados de negócios, sem se preocupar com o gerenciamento do data warehouse.
Amazon Redshift Serverless: o Amazon Redshift Serverless é uma opção de tecnologia sem servidor do Amazon Redshift que facilita a execução e a escalabilidade de análises em segundos, sem a necessidade de configurar e gerenciar a infraestrutura de data warehouse. Com o Amazon Redshift Serverless, qualquer usuário, incluindo analistas de dados, desenvolvedores, profissionais de negócios e cientistas de dados, pode obter insights de dados simplesmente carregando e consultando dados no data warehouse. Saiba mais.
Query Editor v2: use SQL para tornar seus dados e data lake do Amazon Redshift mais acessíveis para analistas de dados, engenheiros de dados e outros usuários de SQL com um workbench de analista baseado na Web para exploração e análise de dados. O Query Editor v2 permite visualizar os resultados da consulta com um único clique, criar esquemas e tabelas, carregar dados visualmente e navegar por objetos de banco de dados. Ele também fornece um editor intuitivo para criar e compartilhar consultas, análises, visualizações e anotações SQL e compartilhá-las com segurança com sua equipe.
Design de tabela automatizado: o Amazon Redshift monitora as workloads do usuário e usa algoritmos sofisticados para encontrar maneiras de melhorar o layout físico dos dados para otimizar as velocidades de consulta. A otimização automática de tabela seleciona as melhores chaves de classificação e distribuição para otimizar a performance da workload do cluster. Se o Amazon Redshift determinar que a aplicação de uma chave melhorará a performance do cluster, as tabelas serão alteradas automaticamente, sem a necessidade de intervenção do administrador. Os recursos adicionais Automatic Vacuum Delete, Automatic Table Sort e Automatic Analyze eliminam a necessidade da manutenção manual e ajuste dos clusters do Redshift para conseguir a melhor performance para novos clusters e workloads de produção.
Consulte usando suas próprias ferramentas: o Amazon Redshift oferece a flexibilidade de executar consultas no console ou conectar ferramentas de cliente SQL, bibliotecas ou ferramentas de ciência de dados, incluindo Amazon QuickSight, Tableau, PowerBI, QueryBook e Jupyter Notebook.
API simples para interagir com o Amazon Redshift: o Amazon Redshift permite acessar dados facilmente com todos os tipos de aplicações baseadas em serviços da Web nativos da nuvem, conteinerizadas e sem servidor, assim como aplicações orientadas a eventos. A API Data do Amazon Redshift simplifica o acesso, a ingestão e a saída de dados por meio de linguagens e plataformas de programação compatíveis com o AWS SDK, como Python, Go, Java, Node.js, PHP, Ruby e C++. A API Data elimina a necessidade de configurar drivers e gerenciar conexões de banco de dados. Pelo contrário, você precisa executar comandos SQL para um cluster Amazon Redshift simplesmente chamando um endpoint da API protegido fornecido pela Data API. A Data API cuida do gerenciamento das conexões do banco de dados e do buffer dos dados. A Data API é assíncrona para que você possa recuperar seus resultados mais tarde. Os resultados da consulta são armazenados por 24 horas.
Tolerante a falhas: há vários recursos que aprimoram a confiabilidade do cluster de data warehouse. Por exemplo, o Amazon Redshift monitora a integridade do cluster de maneira contínua, replica novamente de modo automático os dados de unidades com falha e substitui os nós conforme necessário para oferecer tolerância a falhas. Os clusters também podem ser realocados para zonas de disponibilidade (AZs) alternativas sem qualquer perda de dados ou alterações de aplicação.
A AWS conta com recursos de segurança abrangentes para cumprir os requisitos mais rigorosos. O Amazon Redshift oferece segurança de dados pronta para uso sem custo adicional.
Controles de acesso detalhados: os controles de segurança detalhados de linha e coluna garantem que os usuários vejam somente os dados aos quais têm acesso. O Amazon Redshift é integrado ao AWS Lake Formation, o que garante que os controles de acesso de coluna do Lake Formation também sejam aplicados às consultas do Redshift que acessam dados no data lake.
O compartilhamento de dados do Amazon Redshift oferece suporte ao controle de acesso centralizado com a formação do AWS Lake para simplificar a governança dos dados compartilhados do Amazon Redshift. O AWS Lake Formation (LF) é um serviço que facilita a configuração de data lakes seguros, o gerenciamento centralizado do acesso granular a dados em todos os serviços de consumo e a aplicação de controles de nível de linha e de coluna.
Mascaramento dinâmico de dados: Com o Mascaramento dinâmico de dados, os clientes podem proteger facilmente seus dados confidenciais limitando a quantidade de dados identificáveis visíveis para os usuários e também definir vários níveis de permissões nesses campos para que diferentes usuários e grupos possam ter níveis variados de acesso aos dados sem precisar criar várias cópias de dados, tudo por meio da interface SQL familiar do Redshift.
Multi AZ: a nova configuração Multi-AZ do Redshift expande ainda mais os recursos de recuperação, reduzindo o tempo de recuperação e garantindo a capacidade de recuperação automática sem perda de dados. Um data warehouse Multi-AZ do Redshift maximiza a performance e o valor ao oferecer alta disponibilidade sem precisar usar recursos de espera.
Criptografia de ponta a ponta: com apenas algumas configurações de parâmetro, é possível configurar o Amazon Redshift para usar SSL na proteção de dados em trânsito e criptografia AES-256 acelerada por hardware na proteção de dados em repouso. Se você optar por habilitar a criptografia de dados em repouso, todos os dados gravados em disco serão criptografados, assim como os backups. Por padrão, o Amazon Redshift cuida do gerenciamento de chaves.
Isolamento de rede: o Amazon Redshift permite configurar regras de firewall para controlar o acesso de rede a um cluster de data warehouse. Você pode executar o Amazon Redshift dentro da Amazon Virtual Private Cloud (VPC) para isolar um cluster de data warehouse em sua própria rede virtual e conectá-lo à infraestrutura de TI existente usando uma VPN com IPsec criptografado padrão do setor.
Auditoria e conformidade: o Amazon Redshift é integrado ao AWS CloudTrail para possibilitar a auditoria de todas as chamadas de API do Redshift. O Redshift registra em log todas as operações de SQL, inclusive tentativas de conexão, consultas e alterações no data warehouse. Você pode acessar esses logs usando consultas SQL em tabelas do sistema ou salvar os logs em um local seguro no Amazon S3. O Amazon Redshift está em conformidade com os requisitos de SOC1, SOC2, SOC3 e PCI DSS Nível 1. Para obter mais detalhes, consulte Conformidade da Nuvem AWS.
Tokenização: as User-Defined Function (UDFs – Funções definidas pelo usuário) do Amazon Lambda permitem usar uma função do AWS Lambda como uma UDF no Amazon Redshift e a chamar a partir das consultas SQL do Redshift. Com essa funcionalidade, é possível escrever extensões personalizadas para sua consulta SQL para obter uma integração maior com outros serviços ou produtos de terceiros. Você pode escrever Lambda UDFs para permitir a tokenização externa, o mascaramento dos dados, a identificação ou não dos dados integrando com revendedores como Protegrity, e proteger ou não dados sigilosos com base nas permissões de um usuário e grupos na hora da consulta.
Saiba mais sobre as novidades.
Acesse a documentação do Amazon Redshift para obter informações mais detalhadas sobre o produto.
Saiba mais sobre a definição de preço do Amazon Redshift