Visão geral

A operação do Amazon Redshift é mais econômica que a de qualquer outro data warehouse. Comece aos poucos, pagando 0,25 USD por hora e escale para petabytes de dados e milhares de usuários simultâneos. Escolha o que é certo para as necessidades empresariais. Você pode aumentar o armazenamento sem provisionar computação em excesso e tem a flexibilidade de aumentar a capacidade de computação sem aumentar os custos de armazenamento.

O que esperar
Primeiro, escolha a melhor configuração de cluster para suas necessidade ao se informar melhor sobre os tipos de nós na seção a seguir. Você poderá escalar o cluster, pausar e retomar o cluster e alternar entre tipos de nós com uma única chamada de API ou alguns cliques no console do Amazon Redshift. Você verá a definição de preço sob demanda antes de escolher. Mais tarde, poderá optar por comprar nós reservados com descontos significativos.

Assim que escolher, você pode usar o redimensionamento elástico para ajustar facilmente em minutos a quantidade de capacidade computacional oferecida para um processamento em estado estável. Com o programador de redimensionamento, você pode adicionar e remover nós diariamente ou semanalmente para otimizar os custos e obter o melhor desempenho. Para cargas de trabalho dinâmicas, você pode usar a escalabilidade de simultaneidade para provisionar automaticamente a capacidade computacional adicional e pagar apenas pelo que usar em uma base por segundo após gastar todos os créditos livres (consulte definição de preço da escalabilidade de simultaneidade).

Tipos de nós do Amazon Redshift

O Amazon Redshift oferece diferentes tipos de nós para acomodar suas cargas de trabalho, e recomendamos a escolha de RA3 ou DC2 com base no desempenho necessário, tamanho dos dados e seu crescimento.
 
Os nós RA3 com armazenamento gerenciado permitem que você otimize o data warehouse com escalabilidade e pagando separadamente por computação e armazenamento gerenciado. Com o RA3, você escolhe o número de nós com base nos requisitos de desempenho e paga apenas pelo armazenamento gerenciado utilizado. Você deve dimensionar o cluster RA3 com base na quantidade de dados processada diariamente.

O armazenamento gerenciado do Redshift usa SSDs grandes e de alto desempenho em cada nó RA3 para armazenamento rápido no local e o Amazon S3 para armazenamento resiliente de longo prazo. Se os dados de um nó ultrapassarem o tamanho dos SSDs grandes no local, o armazenamento gerenciado do Redshift transferirá automaticamente esses dados para o Amazon S3. Você paga a mesma taxa reduzida pelo armazenamento gerenciado do Redshift, independentemente se os dados estiverem em SSDs de alta performance ou no S3. Para cargas de trabalho que exigem armazenamento crescente, o armazenamento gerenciado permite que você escale automaticamente a capacidade de armazenamento do data warehouse sem adicionar e pagar por nós adicionais.

Os nós DC2 permitem que você crie data warehouse com uso intensivo de computação e armazenamento SSD local. Você escolhe o número de nós necessários com base no tamanho dos dados e requisitos de desempenho. Os nós DC2 armazenam os dados localmente para alto desempenho e, conforme o tamanho dos dados cresce, você pode adicionar mais nós computacionais para aumentar a capacidade de armazenamento do cluster. Para conjuntos de dados abaixo de 1 TB não compactados, recomendamos os tipos de nós DC2 para obter o melhor desempenho com o menor preço. Se você espera que os dados cresçam, recomendados o uso dos nós RA3, para que você possa dimensionar computação e armazenamento de forma independente para atingir o melhor preço e desempenho.

Nós DS2 permitem criar grandes data warehouses usando discos rígidos (HDDs) e recomendamos o uso dos nós RA3 em seu lugar. Se você estiver usando os nós DS2, consulte Visão geral de tipos de nó RA3 no guia de gerenciamento de cluster para diretrizes atualizadas. Os clientes que usam oito ou mais nós de DS2.xlarge ou qualquer número de nós DS2.8xlarge podem fazer a atualização para o RA3 e obter 2x mais armazenamento e melhor desempenho pelo mesmo preço sob demanda.

Recursos do Redshift com definição de preço com pagamento conforme o uso

  • Definição de preço do Amazon Redshift Spectrum: permite executar diretamente consultas SQL dos dados de um data lake do S3 em volumes de até exabytes. Você simplesmente paga pelo número de bytes verificados.
  • Definição de preço da escalabilidade de simultaneidade: cada cluster recebe até uma hora de créditos gratuitos de escalabilidade de simultaneidade por dia, o que é suficiente para 97% dos clientes. Dessa forma, você pode disponibilizar performance de consulta rápida e consistente, mesmo com milhares de usuários e consultas simultâneos. Você paga somente uma taxa sob demanda por segundo para o uso que excede os créditos gratuitos. 
  • Definição de preço de armazenamento gerenciado do Redshift: oferece a flexibilidade de pagar apenas pelos dados armazenados em clusters RA3, independentemente do número de nós de computação provisionados. Você simplesmente paga por hora pela quantidade total de dados no armazenamento gerenciado.

Definição de preço sob demanda

A definição de preço sob demanda do Amazon Redshift permite pagar pela capacidade por hora, sem compromissos ou custos adiantados. Basta pagar uma taxa por hora de acordo com o tipo e o número de nós em um cluster. As horas parciais são cobradas em incrementos de um segundo de acordo com uma mudança de status faturável, como criar, excluir, suspender ou reiniciar um cluster. O recurso de suspende e reiniciar permite suspender a cobrança sob demanda durante o tempo em que o cluster fica suspenso. Durante esse período, você paga apenas pelo armazenamento de backup. Desse modo, você fica livre de planejar e comprar antecipadamente capacidade de data warehouse para atender às suas necessidades e pode gerenciar com economia ambientes para desenvolvimento ou testes.

Geração atual

*Capacidade de armazenamento endereçável total no armazenamento gerenciado em cada nó RA3.

Geração anterior

Como calcular o preço efetivo sob demanda por TB por ano

Para a definição do preço sob demanda, o preço efetivo por TB por ano é o preço por hora da instância, multiplicado pelo número de horas em um ano e dividido pelo número de TB por instância. Para o RA3, os dados armazenados no armazenamento gerenciado são faturados separadamente de acordo com os dados reais armazenados nos tipos de nó RA3. O preço efetivo por TB por ano é calculado apenas para os custos do nó de computação.

Definição de preço do Redshift Spectrum

O Amazon Redshift Spectrum permite que você execute diretamente consultas SQL em exabytes de dados no Amazon S3. A cobrança será feita pelo número de bytes verificados pelo Redshift Spectrum, arredondado para cima para o megabyte mais próximo, com um mínimo de 10 MB por consulta. Instruções de Data Definition Language (DDL – Linguagem de definição de dados), como CREATE/ALTER/DROP TABLE, para gerenciamento de partições e consultas com falha não são cobradas.

É possível melhorar a performance e reduzir os custos armazenando dados em um formato compactado, particionado e colunar. Se você compactar dados usando um dos formatos permitidos do Redshift Spectrum, os custos serão reduzidos pois menos dados serão verificados. Se você armazenar dados em um formato colunar, como Parquet ou ORC, suas cobranças também serão reduzidas, pois o Redshift Spectrum só verificará as colunas necessárias para a consulta.

Custos adicionais

Você é cobrado pelo cluster do Amazon Redshift usado para consultar dados com o Redshift Spectrum. O Redshift Spectrum consulta dados diretamente no Amazon S3. São cobradas taxas do S3 padrão para armazenar objetos em buckets do S3 e pelas solicitações efetuadas para esses buckets. Para obter detalhes, consulte a taxas do Amazon S3

Se você usar o catálogo de dados do AWS Glue com o Amazon Redshift Spectrum, serão cobradas as taxas padrão do catálogo de dados do AWS Glue. Para obter detalhes, consulte a definição de preço do AWS Glue.

Ao usar o Amazon Redshift Spectrum para consultar dados criptografados do AWS Key Management Service (KMS) no Amazon S3, você recebe uma cobrança das taxas padrão do AWS KMS. Para obter detalhes, consulte a definição de preço do AWS KMS.

Exemplos de definição de preço do Redshift Spectrum baseados no preço da região Leste dos EUA (Norte da Virgínia)

Considere uma tabela com 100 colunas de mesmo tamanho, armazenadas no Amazon S3 como arquivo de texto não compactado com um tamanho total de 4 TB. A execução de uma consulta para obter dados de uma única coluna da tabela exige que o Redshift Spectrum verifique o arquivo inteiro, pois os formatos de texto não podem ser divididos. Essa consulta verificaria 4 terabytes e custaria 20 USD (5 USD/TB * 4 TB = 20 USD)

Caso o arquivo seja compactado usando GZIP, será possível obter ganhos de compressão de quatro para um. Nesse caso, o arquivo compactado teria um tamanho de 1 TB. O Redshift Spectrum precisa verificar todo o arquivo. No entanto, como o arquivo tem um quarto do tamanho original, você paga apenas um quarto do custo, ou 5 USD (5 USD/TB * 1 TB = 5 USD)

Se você compactar o arquivo e convertê-lo em um formato colunar como o Apache Parquet, poderá obter ganhos de compressão de quatro para um e ter um arquivo compactado com o tamanho de 1 TB. Usando a mesma consulta acima, o Redshift Spectrum precisa verificar apenas uma coluna no arquivo do Parquet. O custo dessa consulta seria 0,05 USD (5 USD/TB * 1 TB de tamanho do arquivo * 1/100 colunas ou um total de 10 gigabytes verificados = 0,05 USD).

Nota: os exemplos de definição de preço acima são para fins exclusivamente ilustrativos. A taxa de compactação de arquivos e colunas diferentes pode variar.

Definição de preço da escalabilidade de simultaneidade

O Amazon Redshift adiciona automaticamente capacidade para provisionar performance rápida e consistente, mesmo com milhares de usuários e consultas simultâneos. Não é preciso gerenciar recursos, não há custos antecipados e você não é cobrado pelos tempos de inicialização ou término dos clusters temporários. Você pode acumular uma hora de créditos de cluster de escalabilidade de simultaneidade a cada 24 horas durante a execução do cluster principal. É cobrada uma taxa sob demanda por segundo para um cluster de escalabilidade de concorrência usado além dos créditos gratuitos, exclusivamente para atender suas consultas, com uma cobrança mínima de um minuto a cada vez que um cluster de escalabilidade de simultaneidade for ativado. A taxa sob demanda por segundo é baseada no tipo e número de nós em um cluster do Amazon Redshift.

Créditos de escalabilidade da simultaneidade

Os clusters do Amazon Redshift recebem até uma hora de créditos de escalabilidade da simultaneidade gratuita por dia. Os créditos são adquiridos por hora para cada cluster ativo em sua conta da AWS e só podem ser consumidos pelo mesmo cluster depois que os créditos são concedidos. Você pode acumular até 30 horas de créditos de escalabilidade da simultaneidade gratuitos para cada cluster ativo. Créditos não expiram desde que seu cluster não seja encerrado.

Exemplo de definição de preço para Escalabilidade da simultaneidade

Um cluster do Redshift de nó 10 DC2.8XL no Leste dos EUA custa 48 USD por hora. Considere um cenário onde dois clusters temporários são utilizados por cinco minutos além dos créditos gratuitos de escalabilidade de simultaneidade. A taxa sob demanda por segundo da escalabilidade de simultaneidade é 48 USD * 1/3600 = 0,013 USD por segundo. O custo adicional da escalabilidade de simultaneidade neste caso é 0,013 USD por segundo * 300 segundos * 2 clusters temporários = 8 USD. Portanto, o custo total do cluster do Amazon Redshift e dos dois clusters temporários neste caso é 56 USD.

Definição de preço do armazenamento gerenciado do Redshift

Você paga pelos dados armazenados no armazenamento gerenciado de acordo com uma taxa fixa de GB/mês para a sua região. O armazenamento gerenciado é fornecido exclusivamente com tipos de nós RA3 e você paga a mesma taxa reduzida para o armazenamento gerenciado do Redshift, independentemente do tamanho dos dados. O uso de armazenamento gerenciado é calculado por hora de acordo com o total de dados presentes no armazenamento gerenciado (veja o exemplo abaixo, convertendo o uso em GB-horas em taxas em GB-mês). Você pode monitorar a quantidade de dados em um cluster RA3 por meio do Amazon CloudWatch ou do Console de Gerenciamento da AWS. Não se paga nenhuma taxa de transferência de dados entre os nós RA3 e o armazenamento gerenciado. As taxas de armazenamento gerenciado não incluem taxas de armazenamento de backup de snapshots automáticos e manuais (consulte o armazenamento de backup). Após o encerramento do cluster, você continuará a ser cobrado pela retenção dos backups manuais.

Exemplo de definição de preço para armazenamento gerenciado

Suponha que você armazene 100 GB de dados no armazenamento gerenciado, usando os tipos de nós RA3, por 15 dias em abril, e 100 TB de dados para os últimos 15 dias em abril.
Primeiro, vamos calcular o uso do cenário acima em GB-horas. Durante os primeiros 15 dias, você terá o seguinte uso em GB-horas: 100 GB x 15 dias x ( 24 horas/dia) = 36.000 GB-horas.
Durante os últimos 15 dias, você terá o seguinte uso em GB-horas: 100 TB X 1024 GB/TB X 15 dias X ( 24 horas/dia) = 36.864.000 GB-horas

No final de abril, o uso total em GB-horas é: 36.000 GB-horas + 36.864.000 GB-horas = 36.900.000 GB-horas
Convertendo em GB-mês: 36.900.000 GB=horas / 720 horas por mês em abril = 51.250 GB-mês.

Se esses dados foram armazenados na região Leste dos EUA (Norte da Virgínia), o armazenamento gerenciado será cobrado usando a taxa de 0,024 USD/GB-mês. A cobrança do armazenamento mensal para 51.250 GB-mês será: 51.250 GB-mês x 0,024 USD por GB-mês = 1.230 USD
Taxa de armazenamento gerenciado total para abril = 1.230 USD

Definição de preço de instância reservada

Instâncias reservadas são adequadas para cargas de trabalho de produção estáveis e oferecem grandes descontos em relação à definição de preço sob demanda. Em geral, os clientes compram instâncias reservadas após realizar experiências e provas de conceito para validar configurações de produção.

Você pode se beneficiar com economias substanciais em relação às taxas sob demanda comprometendo-se a usar o Amazon Redshift por um período de 1 ou 3 anos. A definição de preço de instâncias reservadas é específica para o tipo de nó adquirido e continuará válida até que o período de vigência da reserva termine. Os preços incluem duas cópias adicionais de dados, uma nos nós do cluster e outra no Amazon S3. Deixe backup, resiliência, disponibilidade, segurança, monitoramento e manutenção por nossa conta.

Há três opções para a definição de preço de instâncias reservadas:

Sem pagamento adiantado – Você não paga nada adiantado e assume o compromisso de pagar por mês durante o período de um ano.

Adiantado parcial – Você paga adiantado uma parte da instância reservada e o restante durante o período de um ou três anos.

Pagamento adiantado integral – Você paga por todo o período da instância reservada (período de um ou três anos) em um único pagamento adiantado.

As instâncias reservadas são um conceito de faturamento e não são usadas para criar clusters de data warehouse. Quando você faz uma compra, serão cobradas as taxas adiantadas e mensais associadas, mesmo que nenhum cluster esteja sendo executado no momento ou se um cluster existente estiver pausado. Para adquirir instâncias reservadas, acesse a guia Reserved Nodes no nosso console.

Podemos encerrar o programa de definição de preço das instâncias reservadas a qualquer momento. Além de estarem sujeitas à definição de preço de instâncias reservadas, elas estão sujeitas a todas as taxas de transferência de dados e outras taxas aplicáveis segundo o Contrato do Cliente da AWS ou outros contratos com a AWS que regem o uso de nossos serviços. 

* A taxa mensal abaixo é a taxa horária real, multiplicada pelo número médio de horas por mês.

** A taxa horária efetiva abaixo é o custo horário da instância amortizado durante todo o período, incluindo qualquer pagamento adiantado.

Geração atual

Geração anterior

Como calcular o preço efetivo de instâncias reservadas por TB por ano

Para instâncias reservadas, some o pagamento adiantado à taxa horária, multiplicado pelo número de horas no período, e dividida pelo número de anos no período e pelo número de TB por nó. Para o RA3, os dados armazenados no armazenamento gerenciado são faturados separadamente de acordo com os dados reais armazenados nos tipos de nó RA3. O preço efetivo por TB por ano é calculado apenas para os custos do nó de computação.

Geração atual

Geração anterior

Calculadora de definição de preço

Armazenamento de backup

O armazenamento de backup é o armazenamento associado com snapshots para data warehouse. Aumentar o período de retenção do backup ou tirar outros snapshots aumenta o armazenamento de backup consumido pelo data warehouse. Dados armazenados em clusters RA3 fazem parte do Redshift Managed Storage (RMS) e são cobrados nas taxas do RMS, mas os snapshots manuais tirados para clusters RA3 são cobrados como armazenamento de backup nas taxas padrão do Amazon S3. Por exemplo, se o seu cluster RA3 tiver 10 TB de dados e 30 TB de snapshots manuais, você será cobrado por 10 TB de RMS e 30 TB de armazenamento de backup. Com clusters de computação densa (DC) e armazenamento denso (DS), o armazenamento é incluído no cluster e não é cobrado separadamente, mas os backups são armazenados de forma externa no S3. O armazenamento de backup além do tamanho de armazenamento fornecido nos clusters DC e DS é cobrado como armazenamento de backup nas taxas padrão do Amazon S3. Os snapshots são cobrados até seu vencimento ou exclusão, inclusive quando o cluster é pausado ou excluído.

Transferência de dados

Não há cobrança para dados transferidos entre o Amazon Redshift e o Amazon S3 dentro da mesma região da AWS para operações de backup, restauração, carregamento e descarregamento. Para todas as outras transferências de dados para dentro e para fora do Amazon Redshift, você será cobrado de acordo com as taxas de transferência de dados padrão da AWS. Especificamente, caso execute o cluster do Amazon Redshift na Amazon VPC, você verá a cobrança de transferência de dados padrão da AWS para transferências de dados feitas por meio de JDBC/ODBC para o endpoint do cluster do Amazon Redshift. Além disso, ao usar o roteamento otimizado de VPC e descarregar dados no Amazon S3 em uma região diferente, será incorrida a cobrança de transferência de dados padrão da AWS. Para obter mais informações sobre as taxas de transferência de dados da AWS, consulte a página de definição de preço do Amazon EC2.

Recursos adicionais de definição de preço

Calculadora de TCO

Calcule o custo Total Cost of Ownership (TCO – Custo total de propriedade)

AWS Pricing Calculator

Calcule facilmente os custos mensais na AWS

Centro de recursos de fatores econômicos

Recursos adicionais para mudar para a AWS

Descubra mais recursos do Amazon Redshift

Visite a página de recursos
Pronto para criar?
Comece a usar o Amazon Redshift
Tem outras dúvidas?
Entre em contato conosco