Definição de preço do AWS Lambda

O custo da duração depende da quantidade de memória alocada para sua função. Você pode alocar qualquer quantidade de memória para sua função entre 128 MB e 10.240 MB, em incrementos de 1 MB. A tabela abaixo contém alguns exemplos do preço por 1 ms associado a diferentes tamanhos de memória.

  • Preço do x86
  • Preço do ARM
  • Preço do x86
  • Preço do ARM

Preço do armazenamento temporário do Lambda

O custo do armazenamento temporário depende da quantidade de armazenamento temporário que você alocar para a sua função e a duração da execução da função, medida em milésimos de segundos. Você pode alocar qualquer quantidade adicional de armazenamento para sua função entre 512 MB e 10.240 MB, em incrementos de 1 MB. Você pode configurar o armazenamento temporário para funções executadas nas arquiteturas x86 e Arm. 512 MB de armazenamento temporário está disponível para cada função Lambda sem custo adicional. Você paga apenas pelo armazenamento temporário adicional que configurar.

Todos os exemplos a seguir são baseados em preços no Leste dos EUA (Norte da Virgínia).

  • Exemplo 1: Backend de aplicações móveis

    Vamos supor que você seja um desenvolvedor de aplicativos móveis que esteja criando um aplicativo de pedidos de alimentos. Os clientes podem usar o aplicativo para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.
    Vamos supor que você seja um desenvolvedor de aplicativos móveis que esteja criando um aplicativo de pedidos de alimentos. Os clientes podem usar o aplicativo para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.

    Para simplificar, vamos supor que seu aplicativo processe três milhões de solicitações por mês. A duração média da execução da função é de 120 ms. Você configurou sua função com 1536 MB de memória, em um processador baseado em x86. A cobrança seria calculada da seguinte forma:

    Cobranças mensais por computação

    O preço mensal de computação é de USD 0,0000166667 por gigabyte por segundo e o nível gratuito oferece 400.000 GB por segundo.
    Computação total (segundos) = 3 milhões * 120 ms = 360.000 segundos
    Computação total (GB/s) = 360.000 * 1536 MB/1024 MB = 540.000 GB/s
    Cálculo total − Cálculo do nível gratuito = cálculo mensal de GB/s faturáveis
    540.000 GB/s − 400.000 GB/s do nível gratuito = 140.000 GB/s
    Cobrança mensal de computação =
    140.000 * USD 0,0000166667 USD = USD 2,33

    Cobranças mensais de solicitações

    O preço da solicitação mensal é de USD 0,20 por milhão de solicitações e o nível gratuito fornece um milhão de solicitações por mês.
    Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
    3 milhões de solicitações – 1 milhão de solicitações de nível gratuito = 2 milhões de solicitações faturáveis mensais
    Cobrança de solicitações mensais = 2 milhões * USD 0,2/milhão = USD 0,40

    Total de cobranças mensais

    Cobrança total = cobrança de computação + cobrança de solicitações = USD 2,33 + USD 0,40 = USD 2,73 por mês

  • Exemplo 2: Enriquecendo a telemetria de streaming com metadados adicionais

    Vamos supor que você seja uma empresa de logística com uma frota de veículos em campo, cada um deles habilitado com sensores e conectividade 4G/5G para emitir dados de telemetria em um Amazon Kinesis Data Stream. Você deseja usar modelos de machine learning (ML) desenvolvidos para inferir a integridade do veículo e prever quando a manutenção de componentes específicos pode ser necessária.
    Vamos supor que você seja uma empresa de logística com uma frota de veículos em campo, cada um deles habilitado com sensores e conectividade 4G/5G para emitir dados de telemetria em um Amazon Kinesis Data Stream. Você deseja usar modelos de machine learning (ML) desenvolvidos para inferir a integridade do veículo e prever quando a manutenção de componentes específicos pode ser necessária.

    Suponha que você tenha 10.000 veículos em campo, cada um emitindo telemetria uma vez por hora de forma escalonada com instabilidade suficiente. Você pretende realizar essa inferência em cada carga útil para garantir que os veículos sejam agendados prontamente para manutenção e garantir a saúde ideal da sua frota de veículos.

    Suponha que o modelo de ML esteja empacotado junto com a função e tenha 512 MB de tamanho. Para inferência, você configurou sua função com 1 GB de memória, e a execução da função leva dois segundos para ser concluída em média em um processador baseado em x86.

    Cobranças mensais de solicitações:
    Por mês, os veículos emitirão 10.000 * 24 * 31 = 7.440.000 mensagens, que serão processadas pela função do Lambda.

    Cobranças mensais de solicitação → 7,44 milhões * USD 0,20/milhão = USD 1.488 ~= USD 1,49

    Cobranças mensais por computação:
    Por mês, as funções serão executadas uma vez por mensagem por dois segundos.

    Duração mensal da computação (segundos) → 7,44 milhões * 2 segundos = 14,88 milhões de segundos
    Computação mensal (GB/s) → 14,88 milhões de segundos * 1024 MB/1024 MB = 14,88 GB/s
    Cobranças mensais de computação → 14,88 milhões de GB/s * USD 0,0000166667 = USD 248,00

    Total de cobranças mensais:
    Cobranças totais mensais = Cobranças de solicitação + Cobranças de computação = USD 1,49 + USD 248,00 = USD 249,49

  • Exemplo 3: Executar ML em tíquetes de suporte ao cliente e interações para melhorar a experiência do cliente

    Vamos supor que você seja uma empresa de serviços financeiros que busca entender melhor seus principais problemas de atendimento ao cliente. Seu objetivo é melhorar a experiência do cliente e reduzir a taxa de abandono de clientes. Seus clientes podem conversar ao vivo com a equipe de suporte ao cliente por meio da aplicação móvel que você fornece. Você decide implantar um modelo de natural language processing (PNL – processamento de linguagem natural).
    Vamos supor que você seja uma empresa de serviços financeiros que busca entender melhor seus principais problemas de atendimento ao cliente. Seu objetivo é melhorar a experiência do cliente e reduzir a taxa de abandono de clientes. Seus clientes podem conversar ao vivo com a equipe de suporte ao cliente por meio da aplicação móvel que você fornece. Você decide implantar um modelo de natural language processing (PNL – processamento de linguagem natural).

    Nesse caso, você está usando o popular modelo Bidirectional Encoder Representations from Transformers (BERT) no AWS Lambda. O modelo ajuda você a analisar e entender as interações de atendimento ao cliente por meio do aplicativo móvel para exibir conteúdo de suporte relevante ou encaminhar o cliente para o agente de atendimento ao cliente apropriado. O número de consultas de suporte que seu modelo de inferência processa varia muito ao longo da semana.

    Vamos supor que suas funções que executam o modelo de inferência recebam seis milhões de solicitações por mês. A duração média da execução da função é de 280 ms. Você configura sua função com 4096 MB de memória em um processador baseado em x86.

    Você também configura a sua função para usar 2048 MB de armazenamento temporário.

    A cobrança seria calculada da seguinte forma:

    Cobranças mensais por computação:
    O preço mensal de computação é de USD 0,0000166667 por GB/s e o nível gratuito oferece 400.000 GB/s.
    Computação total (segundos) = 6M * 280 ms = 1.680.000 segundos
    Computação total (GB/s) = 1.680.000 * 4096 MB/1024 MB = 6.720.000 GB/s
    Computação total – computação de Nível gratuito da AWS = Computação faturável mensal GB/s
    6.720.000 GB/s – 400.000 GB/s do nível gratuito = 6.320.000 GB/s
    Cobranças mensais de computação = 6.320.000 * USD 0,0000166667 = USD 105,33

    Cobranças mensais de solicitações:
    O preço da solicitação mensal é de USD 0,20 por milhão de solicitações e o nível gratuito fornece um milhão de solicitações por mês.
    Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
    6 milhões de solicitações – 1 milhão de solicitações de nível gratuito = 5 milhões de solicitações faturáveis mensais
    Cobranças mensais de solicitações = 5 milhões * USD 0,2/milhão = USD 1

    Cobranças mensais de armazenamento temporário:
    O preço do armazenamento temporário mensal é USD 0,0000000309 por cada GB/segundo, e o Lambda oferece 512 MB de armazenamento sem custo adicional.
    Computação total (segundos) = 6M * 280 ms = 1.680.000 segundos
    Total de armazenamento temporário faturável = 2048 MB – 512 MB = 1536 MB
    Total de armazenamento temporário (GB/s) = 1.680.000 * 1536 MB/1024 MB = 2.520.000 GB/s
    Cobranças mensais de armazenamento temporário = 2.520.000 * USD 0,0000000309 = USD 0,08

    Total de cobranças mensais:
    Cobranças totais = cobranças de computação + cobranças de solicitações = USD 105,33 + USD 1 + USD 0,08 = USD 106,41 por mês

Preços da Simultaneidade provisionada

Habilite a simultaneidade provisionada para suas funções do Lambda para maior controle sobre a performance da aplicação sem servidor. Quando habilitada, a simultaneidade provisionada mantém as funções inicializadas e prontas para responder em questão de milissegundos. Você paga pela quantidade de simultaneidade e pelo período de tempo em que a configura. Quando a Simultânea provisionada estiver habilitada e executada para sua função, você também pagará por Solicitações e Duração com base nos preços abaixo. Se sua função exceder a simultaneidade configurada, você será cobrado pelo excesso de execução de função na taxa descrita na seção de Preço do AWS Lambda acima. Você pode habilitar a simultaneidade provisionada para funções em execução nas arquiteturas x86 e ARM. Para saber mais sobre a simultaneidade provisionada, leia a documentação.

A Simultaneidade provisionada é calculada a partir do momento em que você a habilitada na sua função até que ela seja desabilitada, arredondada para os cinco minutos mais próximos. O preço depende da quantidade de memória alocada à sua função e da quantidade de simultaneidade configurada nela. A duração é calculada a partir do momento em que seu código começa a ser executado até ele retornar ou encerrar, arredondando para os 1 ms** mais próximos. O preço depende da quantidade de memória que você alocar para sua função.

** As cobranças de duração se aplicam ao código que é executado no processador de uma função e também ao código de inicialização que é declarado fora do processador. Para funções Lambda com Extensões do AWS Lambda, a duração também inclui o tempo que leva para o código na última extensão em execução concluir a execução durante a fase de desligamento. Para funções configuradas com Simultaneidade provisionada, o AWS Lambda recicla periodicamente os ambientes de execução e executa novamente seu código de inicialização. Para obter mais detalhes, consulte a documentação do Modelo de programação do Lambda.

O nível gratuito do Lambda não se aplica a funções que habilitam a Simultaneidade provisionada. Se você habilitar a Simultaneidade provisionada para sua função e executá-la, será cobrado por Solicitações e Duração com base no preço abaixo.

Todos os exemplos abaixo estão baseados em preços no Leste dos EUA (Norte da Virgínia).

  • Exemplo 1: Lançamento do aplicação móvel

    Vamos supor que você seja um desenvolvedor de aplicativos móveis e esteja criando um aplicativo móvel para pedidos de alimentos. Os clientes podem usar a aplicação para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda da aplicação, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.
    Vamos supor que você seja um desenvolvedor de aplicativos móveis e esteja criando um aplicativo móvel para pedidos de alimentos. Os clientes podem usar a aplicação para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda da aplicação, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.

    Para simplificar, vamos supor que seu aplicativo processe três milhões de solicitações por mês. A
    duração média da execução da função é de 120 ms. Você configurou sua função com 1536 MB de memória, em um processador baseado em x86.

    Você está lançando a nova versão do seu aplicativo móvel, que você promoveu intensamente. Você espera um pico na demanda durante o dia do lançamento, do meio-dia às 20h. Você quer que seu aplicativo móvel seja receptivo mesmo enquanto a demanda aumenta e diminui rapidamente, para ativar a Simultanidade provisionada em suas funções do Lambda. Você define a Simultânea provisionada como 100.

    Durante essas oito horas, suas funções receberam 500.000 solicitações. A duração média
    de execução da função enquanto a Simultânea provisionada está ativada é de 100 ms. Durante o resto do mês, a aplicação recebe 2,5 milhões de solicitações adicionais, e suas funções são executadas em resposta a elas sem a Simultânea provisionada habilitada.

    A cobrança seria calculada da seguinte forma:

    Cobranças pela Simultaneidade provisionada:
    O preço da simultaneidade provisionada é de USD 0,0000041667 por GB-s
    Período total de tempo em que a Simultaneidade provisionada está habilitada (segundos) = 8 horas = 28.800 segundos
    Simultâneo total configurado (GB): 100 * 1536 MB/1024 MB = 150 GB
    Valor total da simultaneidade provisionada (GB-s) = 150 GB * 28.800 segundos = 4.320.000 GB-s
    Cobranças de simultaneidade provisionada: 4,32 milhões de GB/s * USD 0,0000041667 = USD 18

    Cobranças de solicitação:
    O preço de solicitações mensais é USD 0,20 por 1 milhão de solicitações e o nível gratuito oferece 1 milhão de solicitações por mês.
    Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
    3.000.000 solicitações – 1 milhão de solicitações de nível gratuito = 2.000.000 de solicitações faturáveis mensais
    Cobranças mensais de solicitação = 2 * USD 0,20 = USD 0,40

    Cobranças por computação enquanto a Simultaneidade provisionada está habilitada:
    O preço da computação é USD 0,0000097222 por GB-s
    Duração total da computação (segundos) = 500.000 * 100ms = 50.000 segundos
    Computação total (GB/s) = 50.000 segundos * 1536 MB/1024 MB = 75.000 GB/s.
    Cobranças totais de computação = 75.000 GB/s * USD 0,0000097222 = USD 0,73

    Cobranças de computação enquanto a Simultaneidade provisionada está desabilitada:
    O preço mensal de computação é de USD 0,0000166667 por gigabyte por segundo e o nível gratuito oferece 400.000 GB por segundo.
    Computação total (segundos) = 2,5 M * 120 ms = 300.000 segundos
    Computação total (GB/s) = 300.000 * 1536 MB/1024 MB = 450.000 GB/s
    Cálculo total − cálculo do nível gratuito = cálculo mensal de GB/s faturáveis
    450.000 GB/s − 400.000 GB/s do nível gratuito = 50.000 GB/s
    Cobrança mensal de computação = 50.000 * USD 0,0000166667 = USD 0,83

    Total de cobranças mensais:
    Cobranças totais = Cobranças de simultaneidade provisionada + Cobranças de solicitação + Cobranças de computação enquanto a Simultânea provisionada está habilitada + Cobranças de computação enquanto a Simultânea provisionada está desabilitada
    Cobrança total = USD 18 + USD 0,40 + USD 0,73 + USD 0,83 = USD 19,96

  • Exemplo 2: Encaminhamento de clientes para o conteúdo da solução de suporte mais relevante durante a Cyber Monday

    Vamos supor que você seja um varejista que realiza uma grande venda durante a Cyber Monday, um feriado de comércio eletrônico que ocorre na segunda-feira após o Dia de Ação de Graças nos Estados Unidos. Seus clientes podem conversar ao vivo com o suporte ao cliente através do aplicativo móvel que você fornece. Você decide implantar um modelo de processamento de linguagem natural (PNL).
    Vamos supor que você seja um varejista que realiza uma grande venda durante a Cyber Monday, um feriado de comércio eletrônico que ocorre na segunda-feira após o Dia de Ação de Graças nos Estados Unidos. Seus clientes podem conversar ao vivo com o suporte ao cliente através do aplicativo móvel que você fornece. Você decide implantar um modelo de processamento de linguagem natural (PNL).

    Nesse caso, você está usando o popular modelo Bidirectional Encoder Representations from Transformers (BERT) no AWS Lambda. O modelo ajuda você a analisar e entender as interações de atendimento ao cliente por meio do aplicativo móvel para exibir conteúdo de suporte relevante ou encaminhar o cliente para o agente de atendimento ao cliente apropriado. Você receberá muito mais consultas de suporte ao cliente durante essa venda do que o normal, então decide ativar a Simultaneidade provisionada em suas funções do Lambda para que sua aplicação responda rapidamente, mesmo com picos de tráfego.

    Vamos supor que suas funções recebam dois milhões de solicitações durante as 24 horas do evento de venda, enquanto a Simultaneidade provisionada está habilidata. A duração média da execução da função é de 280 ms. Você configura sua função com 4.096 MB de memória em um processador baseado em x86 e define a Simultaneidade provisionada em sete.

    A cobrança seria calculada da seguinte forma:

    Cobranças pela Simultaneidade provisionada:
    O preço da simultaneidade provisionada é de USD 0,0000041667 por GB-s.
    Período total de tempo para o qual a Simultaneidade provisionada está habilitada (segundos) = 24 horas * 3.600 segundos = 86.400 segundos
    Simultaneidade total configurada (GB): 7 * 4096 MB/1024 MB = 28 GB
    Valor total da simultaneidade provisionada (GB-s) = 28 GB * 86.400 segundos = 2.419.200 GB-s
    Cobranças de Simultaneidade provisionada = 2.419.200 GB/s * USD 0,0000041667 = USD 10,08

    Cobranças por computação enquanto a Simultaneidade provisionada está habilitada:
    O preço da computação é USD 0,0000097222 por GB-s.
    Duração total da computação (segundos) = 2.000.000 * 280 ms = 560.000 segundos
    Computação total (GB-/) = 560.000 segundos * 4096 MB/1024 MB = 2.240.000 GB/s.
    Cobranças totais de computação = 2.240.000 GB-s * USD 0,0000097222 = USD 21,78

    Cobranças mensais de solicitações:
    O preço mensal de solicitações é USD 0,20 por 1 milhão de solicitações
    Cobrança de solicitações mensais = 2 milhões * USD 0,2/milhão = USD 0,40

    Total de cobranças mensais:
    Cobranças totais = Cobranças de simultaneidade provisionada + Cobranças de computação enquanto a simultaneidade provisionada está habilitada + Cobranças de solicitação = USD 10,08 + USD 21,78 + USD 0,40 = USD 32,26

Transferência de dados e outras cobranças

Transferência de dados
Os dados transferidos “para dentro” e “para fora” das suas funções do AWS Lambda, de fora da região em que a função executou, serão cobrados de acordo com as taxas de transferência de dados do Amazon EC2, conforme listado em "Transferência de dados”.

A transferência de dados com funções do AWS Lambda é gratuita na mesma região da AWS entre os seguintes serviços: Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) e Amazon SimpleDB.

O uso da Amazon Virtual Private Cloud (VPC) ou do emparelhamento de VPC, com funções do AWS Lambda, resultará em cobranças adicionais, conforme explicado na página de definição de preço sob demanda do Amazon Elastic Compute Cloud (EC2). Uma conexão de emparelhamento de VPC é uma conexão de rede entre duas VPCs que permite direcionar o tráfego entre elas usando endereços IPv4 ou IPv6 privados

Cobranças adicionais
Você pode incorrer em cobranças adicionais se a sua função do Lambda utiliza outros serviços da AWS ou transfere dados. Por exemplo, se a função do Lambda lê e grava dados no Amazon S3, você será cobrado pelas solicitações de leitura e gravação e pelos dados armazenados no Amazon S3.

Para obter mais detalhes sobre a definição de preço dos serviços da AWS, consulte a seção de definição de preço das páginas de detalhes relevantes dos serviços da AWS.


Preço do Lambda@Edge

As funções Lambda@Edge são medidas com uma granularidade de 1 ms

Exemplos de definição de preço para o Lambda@Edge

  • Exemplo 1

    Se a função Lambda@Edge executou 10 milhões de vezes em um mês, e executou durante 10 ms a cada vez, a cobrança seria calculada da seguinte forma:
    Se a função Lambda@Edge executou 10 milhões de vezes em um mês, e executou durante 10 ms a cada vez, a cobrança seria calculada da seguinte forma:

    Cobranças mensais por computação

    O preço mensal de computação é de 0,00000625125 USD por 128 MB-segundo

    Total de computação (segundos) = 10M * (0,01 seg.) = 100.000 segundos

    Cobrança mensal de computação = 100.000 * 0,00000625125 USD = 0,63 USD


    Cobrança mensal de solicitações

    O preço mensal de solicitações é 0,60 USD por 1 milhão de solicitações.

    Cobrança mensal de solicitações = 10 milhões * 0,6 USD/milhão = 6 USD
     

    Total de cobranças mensais

    Cobranças totais = cobrança de computação + cobrança de solicitações = 0,63 USD + 6 USD = 6,63 USD por mês

Recursos adicionais de preço

Calculadora de preços da AWS

Calcule facilmente os custos mensais na AWS

Obtenha assistência de preços

Entre em contato com os especialistas da AWS para obter um orçamento personalizado