Visão geral
Com o Amazon Redshift, comece aos poucos, pagando USD 0,25 por hora e aumente a escala na vertical para petabytes de dados e milhares de usuários simultâneos. Escolha o que é certo para suas necessidades de negócios, com a capacidade de aumentar o armazenamento sem provisionar em excesso a computação ou o armazenamento. Com o Amazon Redshift provisionado, você pode escolher instâncias sob demanda e pagar pelo banco de dados por hora, sem compromissos de longo prazo ou taxas iniciais, ou escolher instâncias reservadas para economizar ainda mais. Como alternativa, o Amazon Redshift Serverless permite que você pague pelo uso iniciando, desativando e aumentando ou reduzindo a escala verticalmente da capacidade de forma automática com base nas necessidades de sua aplicação. Assim, você paga apenas pela capacidade consumida durante o processamento da workload.
O que esperar com o Amazon Redshift provisionado:
Primeiro, saiba mais sobre os tipos de nós para escolher a melhor configuração de cluster para suas necessidades. Você poderá rapidamente escalar, pausar e retomar o cluster e alternar entre tipos de nós com uma única chamada de API ou alguns cliques no console do Redshift. Você verá o preço sob demanda antes de escolher. Mais tarde, poderá optar por comprar nós reservados com descontos significativos.
Assim que escolher, você pode usar o redimensionamento elástico para ajustar facilmente em minutos a capacidade computacional provisionada, para um processamento em estado estável. Com o programador de redimensionamento, você pode adicionar e remover nós diariamente ou semanalmente para otimizar os custos e obter a melhor performance. Para workloads dinâmicas, você pode usar a escalabilidade de simultaneidade para provisionar automaticamente uma capacidade computacional adicional e pagar apenas pelo que usar por segundo após gastar todos os créditos livres (consulte Preço da escalabilidade de simultaneidade).
Calculadora de preços da AWS
Calcule o custo de seu Amazon Redshift e da arquitetura em uma única estimativa.
Tipos de nós do Amazon Redshift
Nós RA3 com armazenamento gerenciado permitem que você otimize o data warehouse ao escalar e pagar de forma independente por computação e armazenamento gerenciado. Com o RA3, você escolhe o número de nós com base nos requisitos de performance e paga apenas pelo armazenamento gerenciado que utilizar. Você deve dimensionar o cluster RA3 com base na quantidade de dados processada diariamente.
O Armazenamento gerenciado do Redshift (RMS) usa unidades de estado sólido (SSDs) grandes e de alta performance em cada nó RA3 para armazenamento local rápido e o Amazon Simple Storage Service (Amazon S3) para armazenamento durável de longo prazo. Se os dados de um nó ultrapassarem o tamanho dos SSDs grandes no local, o RMS transferirá automaticamente esses dados para o Amazon S3. Você paga a mesma taxa reduzida pelo RMS, independentemente de os dados residirem em SSDs de alta performance ou no Amazon S3. Para workloads que exigem armazenamento crescente, o armazenamento gerenciado permite que você escale automaticamente a capacidade de armazenamento do data warehouse sem adicionar e pagar por nós adicionais.
Os nós DC2 permitem ter data warehouses com uso intensivo de computação com armazenamento SSD local incluído. Escolha o número de nós necessários com base no tamanho dos dados e requisitos de performance. Os nós DC2 armazenam os dados localmente para alta performance e, conforme o tamanho dos dados cresce, você pode adicionar mais nós de computação para aumentar a capacidade de armazenamento do cluster. Para conjuntos de dados abaixo de 1 TB não compactados, recomendamos os tipos de nós DC2 para obter a melhor performance com o menor preço. Se você espera que os dados aumentem, recomendamos o uso dos nós RA3, para que você possa dimensionar computação e armazenamento de forma independente para obter o melhor preço e a melhor performance.
Preços de recursos do Redshift com pagamento conforme o uso
- Tipos de nós do Amazon Redshift: escolha a melhor configuração de cluster e tipo de nó para suas necessidades e pague pela capacidade por hora com o preço sob demanda do Amazon Redshift. Ao escolher o preço sob demanda, você pode usar o recurso de pausar e retomar para suspender o faturamento sob demanda quando um cluster não estiver sendo usado. Você também pode escolher instâncias reservadas em vez de instâncias sob demanda para workloads de estado estável e obter descontos significativos nos preços sob demanda.
- Preço do Amazon Redshift Spectrum: realize consultas SQL diretamente nos dados do seu data lake do Amazon S3 em nível de exabytes. Você paga apenas pelo número de bytes verificados.
- Preço da escalabilidade de simultaneidade: cada cluster recebe até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia, o que é suficiente para 97% dos clientes. Dessa forma, você pode oferecer performance de consulta rápida e consistente, mesmo com milhares de usuários e consultas simultâneos. Você paga somente uma taxa de serviço sob demanda por segundo para o uso que excede os créditos gratuitos.
- Preço do RMS: pague apenas pelos dados armazenados em clusters RA3, independentemente do número de nós de computação provisionados. Você paga por hora pela quantidade total de dados no armazenamento gerenciado. O RMS também é usado com o Amazon Redshift sem servidor.
- Redshift ML: use SQL para criar, treinar e implantar modelos de machine learning (ML). Depois de esgotar o nível gratuito do Amazon SageMaker, você incorrerá em custos para a criação de seu modelo e armazenamento. O Redshift ML também está disponível para uso com o Amazon Redshift sem servidor.
Teste gratuito do Amazon Redshift
Se você nunca usou o Amazon Redshift sem servidor antes, você está qualificado para um crédito de USD 300 com vencimento de 90 dias para usar em computação e armazenamento. A taxa de consumo desse crédito depende do uso e da capacidade de computação efetivos do seu endpoint sem servidor.
Nas regiões em que o Amazon Redshift sem servidor ainda não está disponível, os clientes podem iniciar um teste gratuito para clusters provisionados. Você está qualificado para um teste gratuito de dois meses do nosso nó DC2.large. Sua organização recebe 750 horas gratuitas por mês, suficientes para executar continuamente um nó DC2.large com 160 GB de armazenamento SSD compactado. Quando o período de teste gratuito de dois meses expirar ou o uso ultrapassar 750 horas por mês, você poderá encerrar o cluster para evitar cobrança, ou mantê-lo em execução com nossa taxa sob demanda padrão. Visite a página do teste gratuito do Amazon Redshift para saber mais.
Preço sob demanda
O preço sob demanda do Amazon Redshift permite que você pague por hora pela capacidade provisionada, sem compromissos ou custos iniciais, para o tipo de nó específico no qual você decidir executar seu data warehouse. Você paga uma taxa por hora com base no tipo e quantidade de nós escolhidos em seu cluster e será cobrado enquanto o cluster estiver em execução. As horas parciais são cobradas em incrementos de um segundo de acordo com uma mudança de status faturável, como criar, excluir, pausar ou retomar um cluster. O recurso de pausar e retomar permite suspender a cobrança sob demanda durante o tempo em que o cluster estiver pausado. Pausar e retomar é uma operação manual ou programada nos tipos de nós do Redshift. Durante esse período de pausa do cluster, você paga apenas pelo armazenamento de backup. Desse modo, você fica livre de ter de planejar e comprar antecipadamente uma capacidade de data warehouse para atender às suas necessidades e pode gerenciar com economia ambientes para desenvolvimento ou testes. Para uma implantação multi-AZ, você pagaria as mesmas taxas de cobranças, mas para o dobro de computação que você pagaria para uma implantação mono-AZ única.
Geração atual
*Capacidade de armazenamento endereçável total no armazenamento gerenciado em cada nó RA3.
Geração anterior
Calcular o preço sob demanda efetivo por terabyte por ano
Para preço sob demanda, o preço efetivo por terabyte por ano é o preço por hora da instância, multiplicado pelo número de horas em um ano e dividido pelo número de terabytes por instância. Para o RA3, os dados armazenados no armazenamento gerenciado são faturados separadamente de acordo com os dados efetivos armazenados nos tipos de nó RA3. O preço efetivo por terabyte por ano é calculado apenas para os custos do nó de computação.
Amazon Redshift sem servidor
Você pode começar a usar o Amazon Redshift sem servidor por apenas USD 3 por hora e pagar somente pela capacidade computacional que seu data warehouse consome quando está ativo. A escala da capacidade do data warehouse automaticamente aumenta ou reduz verticalmente, para atender às necessidades da workload de análise, e é desativada em períodos de inatividade, para economizar custos e tempo de administração. O Amazon Redshift mede a capacidade do data warehouse em Redshift Processing Units (RPUs, unidades de processamento do Redshift). Você paga pelas workloads executadas em RPU por hora, cobradas por segundo (com uma cobrança mínima de 60 segundos), incluindo consultas que acessam dados em formatos de arquivo abertos no Amazon S3. Não há cobrança pelo período de inicialização do data warehouse. Estão incluídas capacidades abrangentes de escalabilidade automática e de segurança. Você não precisa pagar por escalabilidade de simultaneidade e pelo Redshift Spectrum separadamente, pois ambos estão inclusos no Amazon Redshift sem servidor.
Opcionalmente, você pode usar as configurações Base, Max RPU-horas e MaxRPU (capacidade máxima) para controlar o desempenho e os custos do data warehouse.
- Base (Básica): essa configuração permite que você especifique a capacidade básica de data warehouse que o Amazon Redshift usa para atender às consultas. A capacidade básica é especificada em RPUs. Definir uma capacidade computacional básica mais alta pode melhorar a performance de consulta, especialmente para trabalhos de processamento de dados e de ETL (extrair, transformar, carregar) que processam grandes volumes de dados e executam transformações e enriquecimento. Você pode ajustar a configuração básica de 8 RPUs até 512 RPUs em incrementos de 8 (8, 16, 24, 32, 40, 48 e assim por diante, até 512) no console de gerenciamento do Amazon Redshift ou requisitando uma API do Amazon Redshift.
- Max (Máximo): essa configuração permite que você especifique limites de uso e defina ações que o Amazon Redshift executa automaticamente se tais limites forem atingidos, para manter a previsibilidade de seu orçamento. O máximo é especificado em RPUs por hora e é associado a uma duração diária, semanal ou mensal. Definir uma capacidade computacional máxima mais alta pode melhorar a taxa de transferência geral do sistema, o que é especialmente benéfico para workloads que precisam lidar com alta simultaneidade enquanto mantêm alta performance consistentemente. Você pode ajustar a capacidade máxima no console de gerenciamento do Amazon Redshift ou invocando uma API do Amazon Redshift.
- MaxRPU (capacidade máxima) — Essa configuração estabelece a maior contagem de RPUs que o Amazon Redshift sem servidor pode acomodar para fins de escalabilidade. Quando o escalonamento automático de computação é necessário, ter um valor mais alto para MaxRPU pode melhorar o throughput da consulta. Quando o limite máximo de RPU é atingido, a computação do grupo de trabalho não aumenta ainda mais os recursos.
A capacidade de armazenamento primária é cobrada como Armazenamento gerenciado Redshift (RMS) e o armazenamento usado para capturas de imagem do usuário é cobrado de acordo com as taxas de faturamento de backup padrão, informadas nesta página. O armazenamento é cobrado segundo as mesmas taxas que os clusters provisionados do Amazon Redshift. Com o Amazon Redshift sem servidor, você pode restaurar seu data warehouse para pontos específicos dentro das últimas 24 horas, com um detalhamento de 30 minutos, sem custos. Custos de transferência de dados e de ML são aplicados separadamente; o mesmo ocorre com clusters provisionados. A replicação de snapshots e o compartilhamento de dados entre as regiões da AWS são cobrados de acordo com as taxas de transferência informadas nesta página.
Preço do armazenamento gerenciado do Amazon Redshift
Você paga pelos dados armazenados no armazenamento gerenciado de acordo com uma taxa fixa de gigabyte/mês para a sua região. O armazenamento gerenciado é fornecido exclusivamente com tipos de nós RA3 e você paga a mesma taxa reduzida para o armazenamento gerenciado do Redshift, independentemente do tamanho dos dados. O uso de armazenamento gerenciado é calculado por hora de acordo com o total de dados presentes no armazenamento gerenciado (veja o exemplo abaixo, convertendo o uso em gigabytes/horas em taxas em gigabytes por mês). Você pode monitorar a quantidade de dados em um cluster RA3 por meio do Amazon CloudWatch ou do Console de Gerenciamento da AWS. Não há nenhuma cobrança de transferência de dados entre os nós RA3 e o armazenamento gerenciado. As taxas de armazenamento gerenciado não incluem taxas de armazenamento de backup de snapshots automáticos e manuais (consulte o armazenamento de backup). Após o encerramento do cluster, você continuará a ser cobrado pela retenção dos backups manuais.
Exemplo de preço para armazenamento gerenciado
Convertendo em GB/mês: 36.900.000 GB/hora / 720 horas por mês em abril = 51.250 GB/mês.
Preço do Amazon Redshift Spectrum
O Amazon Redshift Spectrum permite que você execute diretamente consultas SQL em exabytes de dados no Amazon S3. A cobrança é feita pelo número de bytes verificados pelo Redshift Spectrum, arredondado para cima para o megabyte mais próximo, com um mínimo de 10 MB por consulta. Não há cobranças para instruções de Data Definition Language (DDL - linguagem de definição de dados), como CREATE/ALTER/DROP TABLE, para gerenciamento de partições e consultas com falha.
As consultas do Amazon Redshift Serverless a dados externos no Amazon S3 não são cobradas separadamente e são incluídas no valor faturado pelo Amazon Redshift Serverless em valores de RPU/hora.
Você pode melhorar a performance da consulta e reduzir os custos ao armazenar dados em um formato de dados compactado, particionado e colunado. Se você compactar dados usando um dos formatos suportados pelo Redshift Spectrum, os custos serão reduzidos, pois menos dados serão verificados. Da mesma forma, se você armazenar dados em um formato colunar, como o formato Apache Parquet ou Optimized Row Columnar (ORC), suas cobranças também serão reduzidas, pois o Redshift Spectrum verificará apenas as colunas necessárias para a consulta.
Custos adicionais
Você é cobrado pelo cluster do Amazon Redshift usado para consultar dados com o Redshift Spectrum. O Redshift Spectrum consulta dados diretamente no Amazon S3. São cobradas taxas do S3 padrão para armazenar objetos em buckets do S3 e pelas solicitações efetuadas para esses buckets. Para obter detalhes, consulte a taxas do Amazon S3.
Se você usar o catálogo de dados do AWS Glue com o Amazon Redshift Spectrum, serão cobradas as taxas padrão do catálogo de dados do AWS Glue. Para obter detalhes, consulte o preço do AWS Glue.
Ao usar o Amazon Redshift Spectrum para consultar dados criptografados do AWS Key Management Service (KMS) no Amazon S3, você recebe uma cobrança nas taxas padrão do AWS KMS. Para obter detalhes, consulte o preço do AWS KMS.
Exemplos de preço do Redshift Spectrum baseados no preço da região Leste dos EUA (Norte da Virgínia)
Considere uma tabela com 100 colunas de mesmo tamanho, armazenadas no Amazon S3 como um arquivo de texto não compactado com um tamanho total de 4 TB. A execução de uma consulta para obter dados de uma única coluna da tabela exige que o Redshift Spectrum verifique o arquivo inteiro, pois os formatos de texto não podem ser divididos. Essa consulta verificaria 4 TB e custaria USD 20 (USD 5/TB x 4 TB = USD 20)
Caso o arquivo seja compactado usando GZIP, será possível obter ganhos de compressão de 4:1. Nesse caso, o arquivo compactado teria um tamanho de 1 TB. O Redshift Spectrum precisa verificar todo o arquivo. No entanto, como o arquivo tem um quarto do tamanho original, você paga apenas um quarto do custo, ou USD 5 (USD 5/TB x 1 TB = USD 5)
Se você compactar o arquivo e convertê-lo em um formato colunar, como o Apache Parquet, poderá obter ganhos de compressão de 4:1 e ter um arquivo compactado com o tamanho de 1 TB. Usando a mesma consulta acima, o Redshift Spectrum precisa verificar apenas uma coluna no arquivo Parquet. O custo dessa consulta seria de USD 0,05 (USD 5/TB x 1 TB de tamanho do arquivo x 1/100 colunas ou um total de 10 GB verificados = USD 0,05)
Observação: os exemplos de preço acima são meramente ilustrativos. A taxa de compactação de arquivos e colunas diferentes pode variar.
Preço da escalabilidade de simultaneidade
O Amazon Redshift adiciona automaticamente capacidade para provisionar performance rápida e consistente, mesmo com milhares de usuários e consultas simultâneos. Não é preciso gerenciar recursos, não há custos antecipados e você não é cobrado pelos tempos de inicialização ou término dos clusters temporários. Você pode acumular uma hora de créditos de cluster de escalabilidade de simultaneidade a cada 24 horas durante a execução do cluster principal. É cobrada uma taxa sob demanda por segundo para um cluster de escalabilidade de simultaneidade usado além dos créditos gratuitos, exclusivamente para atender às suas consultas, com uma cobrança mínima de um minuto toda vez que um cluster de escalabilidade de simultaneidade for ativado. A taxa sob demanda por segundo se baseia no tipo e no número de nós em um cluster do Amazon Redshift.
Por padrão, o Amazon Redshift sem servidor aumenta e reduz a escala de recursos automaticamente, conforme necessário para atender às demandas da workload, e não há cobranças separadas pela escalabilidade de simultaneidade.
Créditos de escalabilidade de simultaneidade
Os clusters do Redshift recebem até uma hora de créditos de escalabilidade de simultaneidade gratuita por dia. Os créditos são adquiridos por hora para cada cluster ativo em sua conta da AWS e só podem ser consumidos pelo mesmo cluster depois que os créditos são concedidos. Você pode acumular até 30 horas de créditos de escalabilidade da simultaneidade gratuitos para cada cluster ativo. Créditos não expiram desde que seu cluster não seja encerrado.
Exemplo de definição de preço para Escalabilidade da simultaneidade
Um cluster do Redshift de nó 10 DC2.8XL no Leste dos EUA custa 48 USD por hora. Considere um cenário em que dois clusters temporários são utilizados por cinco minutos além dos créditos gratuitos de escalabilidade de simultaneidade. A taxa sob demanda por segundo da escalabilidade de simultaneidade é de USD 48 * 1/3.600 = USD 0,013 por segundo. O custo adicional da escalabilidade de simultaneidade nesse caso é de USD 0,013 por segundo * 300 segundos * 2 clusters temporários = USD 8. Portanto, o custo total do cluster do Amazon Redshift e dos dois clusters temporários nesse caso é de USD 56.
Preço do Redshift ML
Ao começar a usar o Redshift ML, você se qualificará para o nível gratuito do Amazon SageMaker, se não tiver usado o Amazon SageMaker anteriormente. Isso inclui duas solicitações CREATE MODEL gratuitas por mês durante dois meses com até 100.000 células por solicitação. O seu nível gratuito começará no primeiro mês, assim que você criar seu primeiro recurso no Redshift ML.
Cobranças do Amazon S3
A solicitação CREATE MODEL também incorre em pequenas cobranças do Amazon S3. Os custos do S3 devem ser inferiores a USD 1 por mês, uma vez que a quantidade de dados do S3 gerados pela solicitação CREATE MODEL são da ordem de alguns gigabytes. Quando a coleta de resíduos está ativada, eles são rapidamente removidos. O Amazon S3 é usado primeiro para armazenar os dados de treinamento produzidos pela consulta SELECT da solicitação CREATE MODEL. Em seguida, ele é usado para armazenar vários artefatos relacionados ao modelo que são necessários para a previsão. O modo de coleta de resíduos padrão removerá os dados de treinamento e os artefatos relacionados ao modelo no final de CREATE MODEL.
Opções de controle de custos
É possível controlar o custo de treinamento definindo o MAX_CELLS. Caso contrário, o valor padrão de MAX_CELLS é um milhão, o que na grande maioria dos casos manterá seu custo de treinamento abaixo de USD 20. Quando o conjunto de dados de treinamento está acima de um milhão, o preço aumenta da seguinte forma:
Número de células | Preço |
Primeiras 10 milhões de células |
20 USD por milhão de células |
Próximas 90 milhões de células |
15 USD por milhão de células |
Acima de 100 milhões de células |
USD 7 por milhão de células |
Observação: o preço real geralmente será menor do que os limites superiores compartilhados acima.
Exemplos de custo da solicitação CREATE MODEL:
- 100.000 células custam USD 20 (= 1 x 20)
- 2.000.000 células custam USD 40 (= 2 x 20)
- 23.000.000 células custam USD 395 (= 10 x 20 + 13 x 15)
- 99.000.000 células custam USD 1.535 (= 10 x 20 + 89 x 15) e
- 211.000.000 células custam USD 2.327 (= 10 x 20 + 90 x 15 + 111 x 7)
Se os dados de treinamento produzidos pela consulta SELECT da solicitação CREATE MODEL excederem o limite MAX_CELLS fornecido (ou o padrão de um milhão, caso você não tenha fornecido um), a solicitação CREATE MODEL escolherá aleatoriamente aproximadamente MAX_CELLS/“número de colunas” registros do conjunto de dados de treinamento e treinará usando essas tuplas escolhidas aleatoriamente. A escolha aleatória é projetada para garantir que o conjunto de dados de treinamento reduzido não tenha qualquer viés. Assim, ao definir o MAX_CELLS, é possível manter seu custo dentro dos limites.
Preço de instâncias reservadas
Instâncias reservadas são adequadas para workloads de produção estáveis e oferecem grandes descontos em relação ao preço sob demanda dos tipos de nós do Amazon Redshift. Em geral, os clientes compram instâncias reservadas após realizar experiências e provas de conceito para validar configurações de produção.
Você pode se beneficiar com economias substanciais em relação às taxas sob demanda comprometendo-se a usar o Amazon Redshift por um período de um ou três anos. O preço de instâncias reservadas é específico para o tipo de nó adquirido e continuará válido até que o período de vigência da reserva termine. Os preços incluem duas cópias adicionais de dados, uma nos nós do cluster e outra no Amazon S3. Deixe o backup, a resiliência, a disponibilidade, a segurança, o monitoramento e a manutenção por nossa conta.
Há três opções de preço de instâncias reservadas:
Sem adiantamento: você não paga nada adiantado e assume o compromisso de pagar por mês durante o período de um ano.
Adiantamento parcial: você paga adiantado uma parte da instância reservada e o restante durante o período de um ou três anos.
Adiantamento integral: você paga por todo o período da instância reservada (período de um ou três anos) em um único pagamento adiantado.
As instâncias reservadas são um conceito de faturamento e não são usadas para criar clusters de data warehouse. Quando você fizer uma compra, serão cobradas as taxas de adiantamento e mensais associadas, mesmo que nenhum cluster esteja sendo executado no momento ou se um cluster existente estiver pausado. Para adquirir instâncias reservadas, acesse a guia Reserved Nodes (Nós reservados) no console do Redshift.
Podemos encerrar o programa de preços das instâncias reservadas a critério próprio. Além de estarem sujeitas à definição de preço, as instâncias reservadas estão sujeitas a todas as taxas de transferência de dados, entre outras, que sejam aplicáveis segundo o Contrato do Cliente da AWS ou outros contratos com a AWS que regem o uso de nossos serviços.
*Este é o pagamento mensal médio no decorrer do período de vigência da instância reservada. Em cada mês, o pagamento mensal real será equivalente ao número real de horas no mês multiplicado pela taxa de uso horário, ou ao número de segundos no mês multiplicado pela taxa de uso horário e dividido por 3600, dependendo do tipo de instância do Redshift executado. A taxa de uso por hora é equivalente à média total dos pagamentos mensais durante o período de vigência da instância reservada, dividida pelo número total de horas (com base em um ano de 365 dias) do período de vigência da instância reservada.
** O preço por hora em vigor ajuda você a calcular a economia de custos de uma instância reservada em relação ao preço da instância sob demanda. Quando você compra uma instância reservada, a cobrança é feita por hora durante todo o período de vigência da instância reservada que você selecionou, independentemente de a instância estar sendo executada. O preço por hora efetivo mostra o custo da instância amortizado por hora. Isso leva em conta o custo total da instância reservada durante todo o período de vigência, incluindo qualquer pagamento adiantado, e o distribui por cada hora do período de vigência da instância reservada.
***Para instâncias reservadas, some o pagamento adiantado à taxa horária, multiplicado pelo número de horas no período, e dividida pelo número de anos no período e pelo número de TB por nó. Para o RA3, os dados guardados no armazenamento gerenciado são faturados separadamente, de acordo com os dados reais armazenados nos tipos de nós RA3. O preço efetivo por TB por ano é calculado apenas para os custos do nó de computação.
Custos da Integração ETL zero
O Amazon Redshift tem integrações ETL zero com bancos de dados de processamento de transações on-line (OLTP) e aplicações corporativas, eliminando a necessidade de criar e gerenciar pipelines de extração, transformação e carregamento (ETL). Os bancos de dados compatíveis incluem Amazon Aurora, Amazon DynamoDB e Amazon Relational Database Service (Amazon RDS) para MySQL. As aplicações corporativas compatíveis incluem Salesforce, ServiceNow, Zendesk e muito mais.
Essas integrações oferecem flexibilidade para que você possa escolher tabelas de dados específicas em um banco de dados ou uma aplicação empresarial para replicar automaticamente para o Amazon Redshift. Essa flexibilidade permite que você execute analytics unificada em várias aplicações e fontes de dados. A AWS não cobra uma taxa adicional pela Integração ETL zero. Você paga pelos recursos existentes usados para criar e processar os dados de alterações criados como parte de uma Integração ETL zero. Isso inclui armazenamento adicional do Amazon Redshift para armazenar dados replicados, recursos de computação para processar a replicação de dados (ou RPUs no Amazon Redshift sem servidor) e custos de transferência de dados entre zonas de disponibilidade para mover dados da origem para o destino. O processamento contínuo de alterações de dados pela Integração ETL zero é oferecido sem custo adicional. Para obter mais informações, visite as páginas de preços do Aurora, Amazon RDS para MySQL, DynamoDB e AWS Glue.
Armazenamento de backup
O armazenamento de backup é o armazenamento associado com snapshots tirados para o data warehouse. Aumentar o período de retenção de backup ou usar outros snapshots aumenta o armazenamento de backup consumido pelo data warehouse. O Amazon Redshift cobra por snapshots manuais que você tira usando o console, a interface de programação de aplicações (API) ou a interface de linha de comandos (CLI). Os snapshots automatizados do Redshift, que são criados por padrão usando o recurso de programação de snapshots do Amazon Redshift, são oferecidos gratuitamente e podem ser retidos por, no máximo, 35 dias. Você não será cobrado pelos pontos de recuperação do Amazon Redshift sem servidor que estejam dentro de um período de 24 horas. Se você decidir manter os pontos de recuperação além das 24 horas, eles incorrerão em cobrança como parte do RMS. Dados armazenados em clusters RA3 fazem parte do RMS e são cobrados nas taxas do RMS, mas os snapshots manuais tirados para clusters RA3 são cobrados como armazenamento de backup nas taxas padrão do Amazon S3 descritas nesta página.
Por exemplo, se o seu cluster RA3 tiver 10 TB de dados e 30 TB de snapshots manuais, você será cobrado por 10 TB de RMS e 30 TB de armazenamento de backup. Com clusters de computação densa (DC) e armazenamento denso (DS), o armazenamento é incluído no cluster e não é cobrado separadamente, mas os backups são armazenados externamente no Amazon S3. O armazenamento de backup além do tamanho de armazenamento fornecido nos clusters de DC e DS é cobrado como armazenamento de backup nas taxas padrão do S3. Os snapshots são cobrados até seu vencimento ou exclusão, inclusive quando o cluster é pausado ou excluído.
Transferência de dados
Não há cobrança para dados transferidos entre o Amazon Redshift e o Amazon S3 dentro da mesma região da AWS para operações de backup, restauração, carregamento e descarregamento. Para todas as outras transferências de dados para dentro e para fora do Amazon Redshift, você será cobrado de acordo com as taxas de transferência de dados padrão da AWS. Especificamente, caso execute o cluster do Amazon Redshift na Amazon Virtual Private Cloud (VPC), você verá a cobrança de transferência de dados padrão da AWS para transferências de dados feitas por meio de JDBC/ODBC para o endpoint do cluster do Amazon Redshift. Além disso, ao usar o roteamento otimizado de VPC e descarregar dados no Amazon S3 em uma região diferente, haverá cobrança de transferência de dados padrão da AWS. Para obter mais informações sobre as taxas de transferência de dados da AWS, consulte a página de preços do Amazon Elastic Cloud Compute (Amazon EC2).
O Amazon Redshift cobra pelo compartilhamento de dados entre regiões, assim como pela cópia de snapshot entre elas. As cobranças de compartilhamento de dados são feitas na região de consumidor em que os dados são acessados. A cópia de snapshot entre regiões é cobrada na região de origem onde está o cluster que criou o snapshot. As taxas de transferência de dados se aplicam a todos os snapshots (automatizados e manuais) e pontos de recuperação. Todas as taxas de transferência de dados para cópia de instantâneo são somente para dados incrementais.
Transferência de dados de compartilhamento de dados de ENTRADA de ou Transferir dados de cópia de snapshot de SAÍDA de
Exemplos de definição de preço
Você usa quatro nós ra3.xlarge e 40 TB do RMS durante um mês. Durante o mês, você também verifica 20 TB de dados usando o Redshift Spectrum e verifica 20 TB de dados. Você usa o preço sob demanda.
A cobrança seria calculada da seguinte forma:
- Custo da instância RA3 do Redshift = 4 instâncias x USD 3,26 por hora x 730 horas em um mês = USD 9.519,20
- Custo do RMS = 40 TB x 1.024 GB por TB x USD 0,024 = USD 983,04
- Custo do Redshift Spectrum = 20 TB x USD 5,00 = USD 100,00
Custo mensal total: USD 10.602,24
Você usa um cluster Multi-AZ implantado em duas AZs ao mesmo tempo. Seu cluster tem quatro nós ra3.4xlarge por AZ e você usa 40 TB de RMS em um mês. Você usa o preço sob demanda.
A cobrança seria calculada da seguinte forma:
- Custo da instância Redshift RA3 para AZ1 = 4 instâncias x USD 3,26 por hora x 730 horas em um mês = USD 9.519,20
- Custo da instância Redshift RA3 para AZ2 = 4 instâncias x USD 3,26 por hora x 730 horas em um mês = USD 9.519,20
- Custo do RMS = 40 TB x 1.024 GB por TB x USD 0,024 = USD 983,04
Custo mensal total: USD 20.021,44
Digamos que você tem um trabalho de processamento de dados que precisa ser executado de hora em hora, das 7h às 19h, em seu data warehouse do Amazon Redshift na região Leste dos EUA (Norte da Virgínia). Para simplificar, vamos assumir que toda vez que o trabalho é executado, demora o mesmo tempo: 10 minutos e 30 segundos. Digamos que o Amazon Redshift usa 128 RPUs de capacidade para executá-lo.
A tabela a seguir resume o uso total de um dia.
Período da consulta |
O trabalho foi executado 13 vezes, entre 7h e 19h, levando cada vez 10 minutos e 30 segundos = 136 minutos e 30 segundos = 8190 segundos |
Capacidade usada |
128 RPU |
Cobranças diárias |
USD 109,20 ([8190 x 128 RPU x USD 0,375 por RPU/hora]/3600) |
Digamos que você tenha uma aplicação de painel no data warehouse do Amazon Redshift na região Leste dos EUA (Norte da Virgínia). A aplicação é usada por diversos usuários na organização (como analistas de dados, desenvolvedores e cientistas de dados) e apresenta períodos de pico e de baixa durante o dia. Mais especificamente, o pico da atividade de usuários ocorre pela manhã, das 9h às 11h, e também das 14h às 16h, quando a maioria dos usuários realizam análises e acessam dados do data warehouse. Suponha que a aplicação possui intervalos de 15 minutos, das 11h às 14h, quando não há atividade de usuários. Tampouco há atividade entre 22h e 5h.
Agora, vamos ver o uso de recursos no data warehouse do Amazon Redshift. Suponha que, para ter melhor controle na performance do preço, você definiu explicitamente a configuração básica do Amazon Redshift sem servidor como 64 RPU. E que, durante os períodos de pico de manhã e à tarde, o Amazon Redshift escala automaticamente e usa um total de 192 RPU e 128 RPU de capacidade, respectivamente.
A tabela a seguir resume o uso total de um dia.
Período |
Período total de execução de consulta |
5h às 9h |
64 RPU por 4 horas = 64 x 4 = 256 RPU/hora |
9h às 11h |
192 RPU por 2 horas = 384 RPU/hora |
11h às 14h |
Excluindo os quatro intervalos de inatividade de 15 minutos, o tempo de atividade é de 2 horas. 64 RPU por 2 horas = 64 x 2 = 128 RPU/hora |
14h às 15h |
128 RPU por 1 hora = 128 RPU/hora |
15h às 22h |
64 RPU por 7 horas = 64 x 7 = 448 RPU/hora |
22h às 5h |
Não há atividade |
Cobranças diárias |
USD 504 ([256+384+128+128+448] x USD 0,375 por RPU/hora) |
Um cluster do Redshift de 10 nós DC2.8XL no Leste dos EUA custa USD 48 por hora. Considere um cenário em que dois clusters temporários são utilizados por cinco minutos além dos créditos gratuitos de escalabilidade de simultaneidade. A taxa sob demanda por segundo da escalabilidade de simultaneidade é de USD 48 x 1/3.600 = USD 0,013 por segundo. O custo adicional da escalabilidade de simultaneidade nesse caso é de USD 0,013 por segundo x 300 segundos x 2 clusters temporários = USD 8. Portanto, o custo total do cluster do Redshift e dos dois clusters temporários é de USD 56.
Considere uma tabela com 100 colunas de mesmo tamanho, armazenadas no Amazon S3 como um arquivo de texto não compactado com um tamanho total de 4 TB. A execução de uma consulta para obter dados de uma única coluna da tabela exige que o Redshift Spectrum verifique o arquivo inteiro, pois os formatos de texto não podem ser divididos. Com base nos preços do Redshift Spectrum para o Leste dos EUA (Norte da Virgínia), essa consulta verificaria 4 TB e custaria USD 20 (USD 5,00/TB x 4 TB = USD 20).
Caso o arquivo seja compactado usando GZIP, será possível obter ganhos de compressão de 4:1. Nesse caso, o arquivo compactado teria um tamanho de 1 TB. O Redshift Spectrum precisa verificar todo o arquivo. No entanto, como o arquivo tem um quarto do tamanho original, você paga apenas um quarto do custo, ou USD 5 (USD 5/TB x 1 TB = USD 5)
Se você compactar o arquivo e convertê-lo em um formato colunar, como o Apache Parquet, poderá obter ganhos de compressão de 4:1 e ter um arquivo compactado com o tamanho de 1 TB. Usando a mesma consulta acima, o Redshift Spectrum precisa verificar apenas uma coluna no arquivo Parquet. O custo dessa consulta seria de USD 0,05 (USD 5/TB x 1 TB de tamanho do arquivo x 1/100 colunas, ou um total de 10 GB verificados = USD 0,05).
Observação: os exemplos de preço acima são meramente ilustrativos. A taxa de compactação de arquivos e colunas diferentes pode variar.
Recursos adicionais de preço
Calcule facilmente os custos mensais na AWS
Entre em contato com os especialistas da AWS para obter um orçamento personalizado
Descubra mais recursos do Amazon Redshift