Com o AWS Glue, você pode pagar uma taxa horária, cobrada por segundo, para crawlers (descoberta de dados) e tarefas de ETL (processamento e carga de dados). Para o catálogo de dados do AWS Glue, você paga uma taxa mensal simples para armazenar e acessar metadados. O primeiro milhão de objetos armazenados e o primeiro milhão de acessos são gratuitos. Se você provisionar um endpoint de desenvolvimento para desenvolver interativamente o código de ETL, pagará uma taxa horária, cobrada por segundo. Para o AWS Glue DataBrew, as sessões interativas são cobradas por sessão e as tarefas do DataBrew são faturadas por minuto. O uso do registro AWS Glue Schema é oferecido sem custo adicional.

Observação: a definição de preço pode variar por região.

  • Tarefas e endpoints de desenvolvimento de ETL
  • Armazenamento e solicitações do catálogo de dados
  • Crawlers
  • Sessões interativas do DataBrew
  • Trabalhos do DataBrew
  • Elastic Views
  • Tarefas e endpoints de desenvolvimento de ETL
  • Exemplos de definição de preço

    Exemplo da trabalho ETL: considere que um trabalho do AWS Glue do tipo Apache Spark é executado por 10 minutos e consome 6 DPUs. O preço de 1 DPU-hora é 0,44 USD. Como a tarefa foi executada por 1/6 de hora e consumiu 6 DPUs, a cobrança será 6 DPUs * 1/6 hora a 0,44 USD por DPU-hora ou 0,44 USD.

    Exemplo de endpoint de desenvolvimento: agora vamos considerar que você provisionou um endpoint de desenvolvimento para conectar seu notebook e desenvolver interativamente o código de ETL. Um endpoint de desenvolvimento é provisionado com 5 DPUs. Se o endpoint de desenvolvimento for executado por 24 minutos ou 2/5 de uma hora, a cobrança será 5 DPUs * 2/5 hora a 0,44 USD por DPU-hora ou 0,88 USD.

    Exemplo do ML Transforms: semelhante às execuções de trabalhos do AWS Glue, o custo de executar o ML Transforms, incluindo FindMatches sobre os dados, varia de acordo com o tamanho e o conteúdo dos dados, bem como o número e os tipos de nós que você usa. Neste exemplo, usamos o FindMatches para integrar informações de pontos de interesse de várias fontes de dados. Com um conjunto de dados de aproximadamente 11 milhões de linhas (1,6 GB), um tamanho dos dados de rótulo (exemplos de correspondências verdadeiras ou não correspondências) de aproximadamente 8 mil linhas (641 kb), em execução em 16 instâncias do tipo G.2x, você teria o tempo de execução da geração do conjunto de rótulos de 34 minutos pelo custo de 8,23 USD, o tempo de execução de estimativa de métricas de 11 minutos pelo custo de 2,66 USD e o tempo de execução de trabalho do FindingMatches de 32 minutos pelo custo de 7,75 USD.

  • Armazenamento e solicitações do catálogo de dados
  • Exemplos de definição de preço

    Exemplo de nível gratuito de catálogo de dados do AWS Glue: vamos considerar que você armazena um milhão de tabelas no catálogo de dados do AWS Glue em um determinado mês e faz um milhão de solicitações para acessar essas tabelas. Você paga 0 USD porque o uso está dentro do nível gratuito do catálogo de dados do AWS Glue. Você pode armazenar o primeiro milhão de objetos e fazer um milhão de solicitações por mês gratuitamente.

    Exemplo do catálogo de dados do AWS Glue: agora, considere que o uso do armazenamento permanece o mesmo, em um milhão de tabelas por mês, mas as solicitações dobram para dois milhões de solicitações por mês. Vamos supor que você também usa crawlers para encontrar novas tabelas, e eles são executados por 30 minutos e consomem 2 DPUs.

    O custo do armazenamento continua 0 USD, pois o armazenamento do primeiro milhão de tabelas é gratuito. O primeiro milhão de solicitações também é gratuito. Será cobrado um milhão de solicitações acima do nível gratuito, o que corresponde a 1 USD. Os crawlers são cobrados a 0,44 USD por DPU-hora. Portanto, você pagará 2 DPUs * 1/2 hora a 0,44 USD por DPU-hora ou 0,44 USD. A fatura mensal total é 1,44 USD.

  • Crawlers
  • Sessões interativas do DataBrew
  • Exemplos de definição de preço

    Exemplo do AWS Glue DataBrew: o preço para cada 30 minutos de sessão interativa é 1,00 USD. Se você utilizar 2 sessões para um projeto do AWS Glue DataBrew, a cobrança será 2 sessões interativas * 1,00 USD por sessão ou 2,00 USD.

    Se um trabalho do AWS Glue DataBrew for executado por 10 minutos e consumir 6 nós do AWS Glue DataBrew, o preço por 1 hora de nó será 0,48 USD. Como o trabalho foi executado por 1/6 de hora e consumiu 6 nós, a cobrança será 6 nós * 1/6 de hora a 0,48 USD por hora de nó ou 0,48 USD.

  • Trabalhos do DataBrew
  • Exemplos de definição de preço

    Exemplo do AWS Glue DataBrew: o preço para cada 30 minutos de sessão interativa é 1,00 USD. Se você usar 2 sessões para um projeto do AWS Glue DataBrew, a cobrança será 2 sessões interativas * 1,00 USD por sessão ou 2,00 USD.

    Se um trabalho do AWS Glue DataBrew for executado por 10 minutos e consumir 6 nós do AWS Glue DataBrew, o preço por 1 hora de nó será 0,48 USD. Visto que a tarefa foi executada por 1/6 de hora e consumiu 6 nós, a cobrança será 6 nós * 1/6 de hora a 0,48 USD por hora de nó ou 0,48 USD.

  • Elastic Views
  • Exemplo 1: Você cria uma visualização que copia dados de uma tabela do Amazon DynamoDB e concretiza em um domínio do Amazon Elasticsearch Service. Seu aplicativo grava 0,5 GB por hora na tabela do DynamoDB a uma média de 8 horas por dia. Como essa visualização copia dados de uma única fonte para um único destino entre o banco de dados AWS gerenciado e serviços analíticos (DynamoDB para Elasticsearch Service), a visualização consome cerca de 1 VPU-hora para processar 1 GB. O armazenamento médio da tabela usado ao longo do mês é de 100 GB.

    Custo mensal do AWS Glue Elastic Views:
    Processamento de visualização
    – 0,5 GB/hr × 1 VPU-hora/GB × 8 hr/dia × 30 dias × 0,16 USD/VPU-hora = 19,20 USD
    Armazenamento de tabela – 100 GB × 0,023 USD/GB-mês = 2,30 USD
    Total – 19,20 USD + 2,30 USD = 21,50 USD

    Exemplo 2: Você cria uma visualização que copia dados de uma tabela do DynamoDB e concretiza em um domínio do Amazon S3. Seu aplicativo grava 2 GB por hora na tabela do DynamoDB a uma média de 12 horas por dia. Como essa visualização copia dados de uma única tabela no DynamoDB, que é um serviço de banco de dados AWS gerenciado, para um único bucket no Amazon S3, que não é um banco de dados gerenciado nem um serviço analítico, consome cerca de 1,3 VPU-hora para processar 1 GB. O armazenamento médio da tabela usado ao longo do mês é de 150 GB.

    Custo mensal do AWS Glue Elastic Views::
    Processamento de visualização – 2 GB/hr × 1,3 VPU-hora/GB × 12 hr/dia × 30 dias × 0,16 USD/VPU-hora = 149,76 USD
    Armazenamento de tabela – 150 GB × 0,023 USD/GB-mês = 3,45 USD
    Total – 149,76 USD + 3,45 USD = 153,21 USD

Observação: a definição de preço pode variar por região. 

Veja a tabela de regiões globais para saber mais sobre a disponibilidade do AWS Glue

Recursos adicionais de preço

Calculadora de definição de preço da AWS

Calcule facilmente os custos mensais na AWS

Centro de recursos de fatores econômicos

Recursos adicionais para mudar para a AWS

Conceitos básicos do AWS Glue
Saiba como começar a usar o AWS Glue

Acesse a página de conceitos básicos.

Saiba mais 
Cadastre-se para obter uma conta da AWS
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastre-se 
Comece a criar no console
Comece a criar no console

Comece a criar com o AWS Glue no Console de Gerenciamento da AWS.

Fazer login