AWS Lambda

AWS Lambda – Definição de preço

Comece a usar gratuitamente

Solicite uma cotação de preços

Visão geral

O AWS Lambda é um serviço computacional com tecnologia sem servidor que permite que você execute o código sem provisionar ou gerenciar servidores. Crie lógica de dimensionamento de cluster com reconhecimento de workload, mantenha integrações de eventos e gerencie tempos de execução com facilidade. Com o Lambda, você pode executar código para praticamente qualquer tipo de aplicação ou serviço de backend, tudo sem administração e pagar apenas pelo que usar. A cobrança é feita com base no número de solicitações de funções e a duração necessária para a execução do código.

O Lambda conta uma solicitação sempre que começa a ser executada em resposta a um acionador de notificação de evento, como do Amazon Simple Notification Service (SNS) ou do Amazon EventBridge, ou uma chamada de invocação, como do Amazon API Gateway, ou por meio do AWS SDK, incluindo chamadas de teste do Console AWS.

A duração é calculada a partir do momento em que o código começa a ser executado até ele retornar ou encerrar, arredondando para os 1 ms* mais próximos. O preço depende da quantidade de memória que você alocar para a função. No modelo de recursos do AWS Lambda, você seleciona a quantidade de memória que quer para sua função. Capacidade de CPU e outros recursos são alocados de forma proporcional. Um aumento no tamanho da memória aciona um aumento equivalente na CPU disponível para sua função. Para saber mais, consulte a documentação referente à configuração de função.

Você pode executar suas funções Lambda em processadores baseados em arquiteturas x86 ou ARM. As funções do AWS Lambda em execução no Graviton2, usando uma arquitetura de processador baseada em ARM projetada pela AWS, oferecem performance de preço até 34% melhor em comparação com as funções em execução em processadores x86. Isso se aplica a uma variedade de workloads sem servidor, como processamento de backends da Web e móveis, de dados e de mídia.

* As cobranças de duração se aplicam ao código executado no manipulador de uma função e ao código de inicialização declarado fora do manipulador. Em funções do Lambda com extensões do AWS Lambda, a duração também inclui o tempo que o código na última extensão em execução leva para concluir a execução durante a fase de desligamento. Em funções do Lambda configuradas com o SnapStart, a duração também inclui o tempo necessário para carregar o runtime, qualquer código executado em um hook de runtime e o código de inicialização executado durante a criação de cópias de snapshots criados para resiliência. Para obter mais detalhes, consulte a documentação do Modelo de programação do Lambda.

O nível gratuito do AWS Lambda inclui um milhão de solicitações gratuitas por mês e 400.000 GB/s de tempo de computação por mês, que podem ser utilizados em funções habilitadas por processadores x86 e Graviton2, em conjunto. Além disso, o nível gratuito inclui 100 GiB de transmissão de respostas HTTP por mês, além dos primeiros 6 MB por solicitação, que são gratuitos. O Lambda também oferece opções de preço em níveis para durações sob demanda acima de determinados limites de uso mensal. O AWS Lambda participa do Savings Plans para computação, um modelo de preço flexível que oferece preços baixos no uso do Amazon Elastic Compute Cloud (Amazon EC2), do AWS Fargate e do Lambda, em troca de um compromisso com uma quantidade consistente de uso (medida em USD/hora) para um período de um ou três anos. Com Compute Savings Plans, você pode economizar até 17% no AWS Lambda. As economias se aplicam à duração e à simultaneidade provisionada. Saiba mais

Calculadora de preços da AWS

Calcule o custo de seu AWS Lambda e da arquitetura em uma única estimativa.

Crie sua estimativa personalizada agora mesmo

Preço do AWS Lambda

Evento assíncrono (incluindo eventos do S3, SNS, EventBridge, StepFunctions, Cloudwatch Logs): será cobrada uma solicitação por cada evento assíncrono para os primeiros 256 KB. Eventos individuais com tamanho superior a 256 KB são cobrados como 1 solicitação adicional para cada 64 KB de bloco até 1 MB.

O custo da duração depende da quantidade de memória alocada para sua função. Você pode alocar qualquer quantidade de memória para sua função entre 128 MB e 10.240 MB, em incrementos de 1 MB. A tabela a seguir contém alguns exemplos do preço por 1 ms associado a diferentes tamanhos de memória para diminuição no uso no primeiro nível de preço: por exemplo, até 6 bilhões de GB-segundos/mês na região Leste dos EUA (Ohio)

Preço do x86
Preço do ARM

Preço do x86
Preço do ARM

Os níveis de preço da duração do Lambda sob demanda são aplicados à duração mensal agregada das suas funções em execução na mesma arquitetura (x86 ou Arm, respectivamente), na mesma região, na conta. Se você estiver usando faturamento consolidado no AWS Organizations, os níveis de preço serão aplicados à duração mensal agregada das suas funções em execução na mesma arquitetura, na mesma região, nas contas da organização.

Lambda Managed Instances

O Lambda Managed Instances permite que você execute funções do Lambda em instâncias do EC2 totalmente gerenciadas na sua VPC, combinando a experiência de desenvolvedor sem servidor do Lambda com a eficiência de custos e a flexibilidade de hardware do EC2. Esse recurso é ideal para workloads estáveis e de alto volume, nas quais você deseja otimizar custos e, ao mesmo tempo, manter a simplicidade operacional do Lambda.

Com o Lambda Managed Instances, você pode selecionar entre uma ampla variedade de tipos de instâncias do EC2 de última geração para atender aos requisitos de sua workload, aproveitar as opções de preços do EC2, incluindo Savings Plans para instâncias do EC2, Savings Plans para computação e Instâncias reservadas, e processar várias solicitações simultaneamente no mesmo ambiente de execução para maximizar a utilização dos recursos. O Lambda gerencia automaticamente o provisionamento, a escalabilidade, a aplicação de patches e o gerenciamento do ciclo de vida das instâncias, enquanto você mantém o modelo de programação familiar do Lambda e a integração perfeita com fontes de eventos como SQS, Kinesis e Kafka.

Preços:
Os preços do Lambda Managed Instances têm três componentes:

1. Cobranças de solicitação: USD 0,20 por milhão de solicitações
2. Taxa de gerenciamento de computação: prêmio de 15% sobre o preço da instância sob demanda do EC2 para as instâncias provisionadas e gerenciadas pelo Lambda (prêmio para cada tipo de instância fornecido abaixo)
3. Cobranças de instâncias do EC2: os preços padrão das instâncias do EC2 se aplicam às instâncias provisionadas no seu provedor de capacidade. Você pode reduzir custos usando Savings Plans para computação, instâncias reservadas ou outras opções de preços do EC2.

Observe que as funções do Lambda Managed Instances não serão cobradas separadamente pela duração da execução de cada solicitação, ao contrário das funções do tipo de computação Lambda (padrão).

Mapeamentos da origem do evento: para workloads que usam unidades de pesquisa de eventos (EPUs) provisionadas com origens de eventos como Kafka ou SQS, aplica-se o preço padrão de EPU.

Taxas de administração

Exemplo de preço: serviço de API de alto throughput

Suponha que você esteja executando um serviço de API de alto tráfego que processa 100 milhões de solicitações por mês, com uma duração média de 200 ms por solicitação. Você configura o provedor de capacidade do Lambda Managed Instances para usar instâncias m7g.xlarge (4 vCPU, 16 GB de memória, Graviton3) e usa um Savings Plans para computação de três anos para obter o máximo de economia de custos.

Cobranças mensais

Cobrança de solicitação
Solicitações mensais: 100 milhões de solicitações
Preço da solicitação: USD 0,20 por milhão de solicitações
Cobranças mensais de solicitações: 100 milhões / 1 milhão × USD 0.20 = USD 20

Cobrança de computação
Tipo de instância: m7g.xlarge
Preço sob demanda do EC2: USD 0,1632 por hora (Leste dos EUA, Norte da Virgínia)
Com desconto do Savings Plans para computação de 3 anos (72%): USD 0,0457 por hora
Estimativa de horas de instância necessárias: cerca de 2.000 horas/mês (com base no padrão de workload e na simultaneidade múltipla)
Custos mensais da instância do EC2: 2.000 × USD 0,0457 = USD 91,40

Cobranças de taxas de administração
Taxa de gerenciamento: 15% do preço sob demanda do EC2
Taxa de gerenciamento por hora: USD 0,1632 × 0,15 = USD 0,02448 por hora
Taxa mensal de gerenciamento: 2.000 × USD 0,02448 = USD 48,96

Cobranças totais por mês
Cobranças totais = Cobranças de solicitação + Cobranças de instâncias do EC2 + Cobranças de taxas de gerenciamento
Total de cobranças = USD 20 + USD 91,40 + USD 48,96 = USD 160,36

Preço das funções duráveis do Lambda

As funções duráveis do Lambda simplificam a forma como você cria aplicações confiáveis de várias etapas e fluxos de trabalho de IA diretamente no modelo de programação existente do Lambda, permitindo workloads resilientes e econômicas de longa duração. Em funções duráveis, você usa operações duráveis, como “etapas” e “esperas”, que são pontos de verificação com dados opcionais armazenados por longos períodos, permitindo que sua função retome a execução após interrupções. Quando as funções são retomadas, o sistema executa a repetição, reexecutando automaticamente o manipulador de eventos desde o início, ignorando os pontos de verificação concluídos e continuando a partir do ponto de interrupção. O ciclo de vida pode incluir várias subinvocações (invocações de funções do Lambda que ocorrem ao retomar após operações de espera, novas tentativas ou falhas de infraestrutura) para concluir a execução.

As cobranças de computação Lambda existentes se aplicam, inclusive para subinvocações de replays. Ao usar operações de espera, a função suspende a execução e, para funções sob demanda, não incorre em cobranças de duração até que a execução seja retomada. Além disso, você é cobrado por operações duráveis (como iniciar execuções, concluir etapas e criar esperas). Você também paga pela quantidade de dados gravados por essas operações (em GB) e pela retenção de dados durante e após a execução (em GB/mês, rateados). O período de retenção após a conclusão pode ser configurado de 1 a 90 dias (padrão, 14 dias).

Para obter uma lista completa e uma descrição detalhada das operações duráveis, consulte o Guia do desenvolvedor do Lambda.

Exemplo de preços:

Um sistema de processamento de sinistros de seguros usa funções duráveis do Lambda para analisar pedidos de detecção de fraudes, coordenar a análise humana de sinistros de alto valor e processar pagamentos aprovados. O processo começa com uma etapa de análise de documentos que leva 30 segundos para realizar a detecção de fraudes e a avaliação de riscos com base no LLM. Em seguida, a execução usa uma espera para suspender a execução de uma revisão humana (normalmente 7 dias de espera), na qual um avaliador analisa os sinistros que excedem os limites de aprovação automática. Finalmente, uma etapa de pagamento que leva 2 segundos para processar a decisão de aprovação para iniciar o pagamento. O sistema processa 1.000.000 sinistros por mês. Cada execução usa uma carga útil de invocação de 8 KB e cargas úteis de 32 KB para análise de sinistros (etapa 1), decisões de aprovação (espera) e processamento final do pagamento (etapa 2). A função é configurada com 1 GB de memória em um processador baseado em ARM. Os registros de sinistros concluídos são retidos por 14 dias para auditoria e conformidade. Observação: os exemplos são baseados no preço no Leste dos EUA (Norte da Virgínia). Todas as execuções começam no início do mês e todas as etapas são bem-sucedidas na primeira tentativa, sem novas tentativas de simplificar os cálculos.

Observação: os exemplos são baseados no preço no Leste dos EUA (Norte da Virgínia). Todas as execuções começam no início do mês e todas as etapas são bem-sucedidas na primeira tentativa, sem novas tentativas de simplificar os cálculos.

Cobranças mensais por computação

Computação total (segundos)	1.000.000 × 32s = 32.000.000 segundos
Computação total (GB)	32.000.000 × 1 GB = 32.000.000 GB
Computação faturável	32.000.000 a 400.000 níveis gratuitos = 31.600.000 GB
Custo de computação	31.600.000 × 0,0000133334 = USD 421,34

Cobranças mensais de solicitação

Total de solicitações	2 invocações (iniciais + após a espera) × 1.000.000 = 2.000.000 solicitações
Solicitações faturáveis	2.000.000 - 1 milhão de nível gratuito = 1.000.000
Custo da solicitação	1M × USD 0,20/M = USD 0,20

Cobranças mensais de funções duráveis

Operações	1M × (1 início de execução + 2 etapas + 1 espera) = 4M
Custo das operações	4 M × USD 8,00/M = USD 32,00
Dados gravados	1M × (invocação de 8 KB + 3 × etapas/esperas de 32 KB) = 104 GB
Custo de gravação de dados	104GB × USD 0,25/GB = USD 26,00
Armazenamento (em execução, incluindo 7 dias de espera)	104GB × (7/30) = 24,27 GB/mês
Armazenamento (retido por 14 dias)	104GB × (14/30) = 48,53 GB/mês
Custo de retenção de dados	(24,27 + 48,53) GB/mês × USD 0,15/GB/mês = USD 10,92

Cobranças mensais totais

Total de cobranças

USD 421,34 + USD 0,20 + USD 32,00 + USD 26,00 + USD 10,92 = USD 490,46

Preços do isolamento de locatários

Habilite o modo de isolamento de locatários para isolar o processamento de solicitações para usuários finais individuais ou locatários que invocam sua função do Lambda. Os ambientes de execução subjacentes para uma função do Lambda isolada por locatário estão sempre associados a um locatário específico e nunca são usados para executar solicitações de outros locatários que invocam a mesma função. Esse recurso simplifica o desenvolvimento e a manutenção de aplicações de vários locatários que processam códigos ou dados específicos de cada locatário com requisitos rigorosos de isolamento entre locatários. A cobrança é feita quando o Lambda cria um novo ambiente de execução isolado do locatário para atender a uma solicitação, dependendo da quantidade de memória alocada para sua função do Lambda e da arquitetura da CPU utilizada. Para obter mais informações sobre o recurso de isolamento de locatários do Lambda, leia a documentação.

Exemplo de preços:

Aplicação SaaS multilocatária

Aplicação SaaS multilocatária

Suponhamos que você esteja construindo uma plataforma de automação que executa códigos fornecidos pelo usuário em resposta a eventos. Por exemplo, uma equipe de TI pode querer executar um fluxo de trabalho automatizado quando um novo funcionário ingressa na organização ou é transferido entre departamentos. Como outro exemplo, uma equipe de DevOps pode querer ativar um fluxo de trabalho de CI/CD quando um desenvolvedor faz o commit de alterações de código em seu repositório de código-fonte. Sua plataforma de automação é multilocatária, o que significa que atende a vários usuários finais. Como você espera uma grande variação na demanda, por horário do dia e para cada usuário final ou locatário, você cria sua plataforma usando serviços sem servidor, incluindo o AWS Lambda.

Sua plataforma de automação oferece suporte à capacidade de executar códigos fornecidos pelo usuário em resposta a eventos. Por não controlar o código fornecido pelos usuários, você habilita o modo de isolamento de locatários para garantir que as invocações da função do Lambda para cada usuário final sejam processadas em ambientes de execução separados e isolados uns dos outros.

Suponha que você tenha configurado sua função do Lambda com 1024 MB de memória e arquitetura de CPU x86. Durante um mês típico, sua função processa 10 milhões de invocações com uma duração média de 2 segundos por invocação. Sua plataforma de SaaS é usada por 1.000 usuários finais ou locatários. Para simplificar, vamos supor que, em média, cada locatário gere 10 mil invocações por mês e o Lambda crie 200 ambientes de execução por locatário (ou seja, uma taxa de inicialização a frio de 2% por locatário).

A cobrança seria calculada da seguinte forma:

Cobranças de solicitação
Por mês, sua função é executada 10 milhões de vezes.

Taxas mensais de solicitação: 10 milhões * USD 0,2/milhão = USD 2.

Cobrança de computação
Por mês, sua função é executada 10 milhões de vezes com uma duração média de 2 segundos. A memória configurada da sua função é de 1024 MB.

Duração mensal da computação (segundos): 10 milhões * 2 s = 20 milhões de segundos
Computação mensal (GB/s): 20 milhões de segundos * 1024 MB/1024 MB = 20 milhões GB/s
Custos mensais de computação: 20 milhões * USD 0,0000166667 = USD 333,34

Taxas de isolamento de locatários
Por mês, em média, sua função atende a 1 mil locatários únicos. Cada locatário invoca a função 10 mil vezes, com uma média de 200 ambientes de execução criados por locatário (ou seja, taxa média de inicialização a frio de 2% para cada locatário).

Ambientes de execução mensais criados para 1.000 locatários: 200 * 1.000 = 200.000
Taxas mensais de isolamento do locatário: 200.000 * USD 0,000167 * 1024 MB / 1024MB = USD 33,4

Cobranças mensais totais
Total de cobranças = Cobranças de solicitações + Cobranças de computação + Cobranças de isolamento de locatários
Total de cobranças = USD 2 + USD 333,34 + USD 33,4 = USD 368,74

Preço do armazenamento temporário do Lambda

O custo do armazenamento temporário depende da quantidade de armazenamento temporário que você alocar para a sua função e a duração da execução da função, medida em milésimos de segundos. Você pode alocar qualquer quantidade adicional de armazenamento para sua função entre 512 MB e 10.240 MB, em incrementos de 1 MB. Você pode configurar o armazenamento temporário para funções executadas nas arquiteturas x86 e Arm. 512 MB de armazenamento temporário está disponível para cada função Lambda sem custo adicional. Você paga apenas pelo armazenamento temporário adicional que configurar.

Todos os exemplos a seguir são baseados em preços no Leste dos EUA (Norte da Virgínia).

Exemplo 1: Backend de aplicações móveis

Vamos supor que você seja um desenvolvedor de aplicativos móveis que esteja criando um aplicativo de pedidos de alimentos. Os clientes podem usar o aplicativo para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.

Vamos supor que você seja um desenvolvedor de aplicativos móveis que esteja criando um aplicativo de pedidos de alimentos. Os clientes podem usar o aplicativo para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.

Para simplificar, vamos supor que seu aplicativo processe três milhões de solicitações por mês. A duração média da execução da função é de 120 ms. Você configurou sua função com 1536 MB de memória, em um processador baseado em x86. A cobrança seria calculada da seguinte forma:

Cobranças mensais por computação

O preço mensal de computação é de USD 0,0000166667 por gigabyte por segundo e o nível gratuito oferece 400.000 GB por segundo.
Computação total (segundos) = 3 milhões * 120 ms = 360.000 segundos
Computação total (GB/s) = 360.000 * 1536 MB/1024 MB = 540.000 GB/s
Cálculo total − Cálculo do nível gratuito = cálculo mensal de GB/s faturáveis
540.000 GB/s − 400.000 GB/s do nível gratuito = 140.000 GB/s
Cobrança mensal de computação = 140.000 * USD 0,0000166667 USD = USD 2,33

Cobranças mensais de solicitações

O preço da solicitação mensal é de USD 0,20 por milhão de solicitações e o nível gratuito fornece um milhão de solicitações por mês.
Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
3 milhões de solicitações – 1 milhão de solicitações de nível gratuito = 2 milhões de solicitações faturáveis mensais
Cobrança de solicitações mensais = 2 milhões * USD 0,2/milhão = USD 0,40

Total de cobranças mensais

Cobrança total = cobrança de computação + cobrança de solicitações = USD 2,33 + USD 0,40 = USD 2,73 por mês
Exemplo 2: Enriquecendo a telemetria de streaming com metadados adicionais

Vamos supor que você seja uma empresa de logística com uma frota de veículos em campo, cada um deles habilitado com sensores e conectividade 4G/5G para emitir dados de telemetria em um Amazon Kinesis Data Stream. Você deseja usar modelos de machine learning (ML) desenvolvidos para inferir a integridade do veículo e prever quando a manutenção de componentes específicos pode ser necessária.

Vamos supor que você seja uma empresa de logística com uma frota de veículos em campo, cada um deles habilitado com sensores e conectividade 4G/5G para emitir dados de telemetria em um Amazon Kinesis Data Stream. Você deseja usar modelos de machine learning (ML) desenvolvidos para inferir a integridade do veículo e prever quando a manutenção de componentes específicos pode ser necessária.

Suponha que você tenha 10.000 veículos em campo, cada um emitindo telemetria uma vez por hora de forma escalonada com instabilidade suficiente. Você pretende realizar essa inferência em cada carga útil para garantir que os veículos sejam agendados prontamente para manutenção e garantir a saúde ideal da sua frota de veículos.

Suponha que o modelo de ML esteja empacotado junto com a função e tenha 512 MB de tamanho. Para inferência, você configurou sua função com 1 GB de memória, e a execução da função leva dois segundos para ser concluída em média em um processador baseado em x86.

Cobranças mensais de solicitações:
Por mês, os veículos emitirão 10.000 * 24 * 31 = 7.440.000 mensagens, que serão processadas pela função do Lambda.

Cobranças mensais de solicitação → 7,44 milhões * USD 0,20/milhão = USD 1.488 ~= USD 1,49

Cobranças mensais por computação:
Por mês, as funções serão executadas uma vez por mensagem por dois segundos.

Duração mensal da computação (segundos) → 7,44 milhões * 2 segundos = 14,88 milhões de segundos
Computação mensal (GB/s) → 14,88 milhões de segundos * 1024 MB/1024 MB = 14,88 GB/s
Cobranças mensais de computação → 14,88 milhões de GB/s * USD 0,0000166667 = USD 248,00

Total de cobranças mensais:
Cobranças totais mensais = Cobranças de solicitação + Cobranças de computação = USD 1,49 + USD 248,00 = USD 249,49
Exemplo 3: Executar ML em tíquetes de suporte ao cliente e interações para melhorar a experiência do cliente

Vamos supor que você seja uma empresa de serviços financeiros que busca entender melhor seus principais problemas de atendimento ao cliente. Seu objetivo é melhorar a experiência do cliente e reduzir a taxa de abandono de clientes. Seus clientes podem conversar ao vivo com a equipe de suporte ao cliente por meio da aplicação móvel que você fornece. Você decide implantar um modelo de natural language processing (PNL – processamento de linguagem natural).

Vamos supor que você seja uma empresa de serviços financeiros que busca entender melhor seus principais problemas de atendimento ao cliente. Seu objetivo é melhorar a experiência do cliente e reduzir a taxa de abandono de clientes. Seus clientes podem conversar ao vivo com a equipe de suporte ao cliente por meio da aplicação móvel que você fornece. Você decide implantar um modelo de natural language processing (PNL – processamento de linguagem natural).

Nesse caso, você está usando o popular modelo Bidirectional Encoder Representations from Transformers (BERT) no AWS Lambda. O modelo ajuda você a analisar e entender as interações de atendimento ao cliente por meio do aplicativo móvel para exibir conteúdo de suporte relevante ou encaminhar o cliente para o agente de atendimento ao cliente apropriado. O número de consultas de suporte que seu modelo de inferência processa varia muito ao longo da semana.

Vamos supor que suas funções que executam o modelo de inferência recebam seis milhões de solicitações por mês. A duração média da execução da função é de 280 ms. Você configura sua função com 4096 MB de memória em um processador baseado em x86.

Você também configura a sua função para usar 2048 MB de armazenamento temporário.

A cobrança seria calculada da seguinte forma:

Cobranças mensais por computação:
O preço mensal de computação é de USD 0,0000166667 por GB/s e o nível gratuito oferece 400.000 GB/s.
Computação total (segundos) = 6M * 280 ms = 1.680.000 segundos
Computação total (GB/s) = 1.680.000 * 4096 MB/1024 MB = 6.720.000 GB/s
Computação total – computação de Nível gratuito da AWS = Computação faturável mensal GB/s
6.720.000 GB/s – 400.000 GB/s do nível gratuito = 6.320.000 GB/s
Cobranças mensais de computação = 6.320.000 * USD 0,0000166667 = USD 105,33

Cobranças mensais de solicitações:
O preço da solicitação mensal é de USD 0,20 por milhão de solicitações e o nível gratuito fornece um milhão de solicitações por mês.
Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
6 milhões de solicitações – 1 milhão de solicitações de nível gratuito = 5 milhões de solicitações faturáveis mensais
Cobranças mensais de solicitações = 5 milhões * USD 0,2/milhão = USD 1

Cobranças mensais de armazenamento temporário:
O preço do armazenamento temporário mensal é USD 0,0000000309 por cada GB/segundo, e o Lambda oferece 512 MB de armazenamento sem custo adicional.
Computação total (segundos) = 6M * 280 ms = 1.680.000 segundos
Total de armazenamento temporário faturável = 2048 MB – 512 MB = 1536 MB
Total de armazenamento temporário (GB/s) = 1.680.000 * 1536 MB/1024 MB = 2.520.000 GB/s
Cobranças mensais de armazenamento temporário = 2.520.000 * USD 0,0000000309 = USD 0,08

Total de cobranças mensais:
Cobranças totais = cobranças de computação + cobranças de solicitações = USD 105,33 + USD 1 + USD 0,08 = USD 106,41 por mês

Preço da simultaneidade provisionada

Habilite a simultaneidade provisionada para suas funções do Lambda para maior controle sobre a performance da aplicação sem servidor. Quando habilitada, a simultaneidade provisionada mantém as funções inicializadas e prontas para responder em questão de milissegundos. Você paga pela quantidade de simultaneidade e pelo período de tempo em que a configura. Quando a Simultânea provisionada estiver habilitada e executada para sua função, você também pagará por Solicitações e Duração com base nos preços abaixo. Se a sua função exceder a simultaneidade configurada, você será cobrado pelo excesso de execução de função na taxa descrita na seção Preços do AWS Lambda acima. Você pode habilitar a simultaneidade provisionada para funções em execução nas arquiteturas x86 e ARM. Para saber mais sobre a simultaneidade provisionada, leia a documentação.

A Simultaneidade provisionada é calculada a partir do momento em que você a habilitada na sua função até que ela seja desabilitada, arredondada para os cinco minutos mais próximos. O preço depende da quantidade de memória alocada à sua função e da quantidade de simultaneidade configurada nela. A duração é calculada a partir do momento em que seu código começa a ser executado até ele retornar ou encerrar, arredondando para os 1 ms** mais próximos. O preço depende da quantidade de memória que você alocar para sua função.

** As cobranças de duração se aplicam ao código que é executado no processador de uma função e também ao código de inicialização que é declarado fora do processador. Para funções Lambda com Extensões do AWS Lambda, a duração também inclui o tempo que leva para o código na última extensão em execução concluir a execução durante a fase de desligamento. Para funções configuradas com Simultaneidade provisionada, o AWS Lambda recicla periodicamente os ambientes de execução e executa novamente seu código de inicialização. Para obter mais detalhes, consulte a documentação do Modelo de programação do Lambda.

O nível gratuito do Lambda não se aplica a funções que habilitam a Simultaneidade provisionada. Se você habilitar a Simultaneidade provisionada para sua função e executá-la, será cobrado por Solicitações e Duração com base no preço abaixo.

Todos os exemplos abaixo estão baseados em preços no Leste dos EUA (Norte da Virgínia).

Exemplo 1: Lançamento do aplicação móvel

Vamos supor que você seja um desenvolvedor de aplicativos móveis e esteja criando um aplicativo móvel para pedidos de alimentos. Os clientes podem usar a aplicação para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda da aplicação, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.

Vamos supor que você seja um desenvolvedor de aplicativos móveis e esteja criando um aplicativo móvel para pedidos de alimentos. Os clientes podem usar a aplicação para pedir comida de um restaurante específico, receber atualizações de status do pedido e pegar a comida quando o pedido estiver pronto. Como você espera uma alta variação na demanda da aplicação, tanto por hora do dia quanto pela localização do restaurante, você cria seu backend móvel usando serviços sem servidor, incluindo o AWS Lambda.

Para simplificar, vamos supor que seu aplicativo processe três milhões de solicitações por mês. A
duração média da execução da função é de 120 ms. Você configurou sua função com 1536 MB de memória, em um processador baseado em x86.

Você está lançando a nova versão do seu aplicativo móvel, que você promoveu intensamente. Você espera um pico na demanda durante o dia do lançamento, do meio-dia às 20h. Você quer que seu aplicativo móvel seja receptivo mesmo enquanto a demanda aumenta e diminui rapidamente, para ativar a Simultanidade provisionada em suas funções do Lambda. Você define a Simultânea provisionada como 100.

Durante essas oito horas, suas funções receberam 500.000 solicitações. A duração média
de execução da função enquanto a Simultânea provisionada está ativada é de 100 ms. Durante o resto do mês, a aplicação recebe 2,5 milhões de solicitações adicionais, e suas funções são executadas em resposta a elas sem a Simultânea provisionada habilitada.

A cobrança seria calculada da seguinte forma:

Cobranças pela Simultaneidade provisionada:
O preço da simultaneidade provisionada é de USD 0,0000041667 por GB-s
Período total de tempo em que a Simultaneidade provisionada está habilitada (segundos): 8 horas * 3.600 segundos = 28.800 segundos
Simultâneo total configurado (GB): 100 * 1536 MB/1024 MB = 150 GB
Valor total da simultaneidade provisionada (GB-s) = 150 GB * 28.800 segundos = 4.320.000 GB-s
Cobranças de simultaneidade provisionada: 4,32 milhões de GB/s * USD 0,0000041667 = USD 18

Cobranças de solicitação:
O preço de solicitações mensais é USD 0,20 por 1 milhão de solicitações e o nível gratuito oferece 1 milhão de solicitações por mês.
Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
3.000.000 solicitações – 1 milhão de solicitações de nível gratuito = 2.000.000 de solicitações faturáveis mensais
Cobranças mensais de solicitação = 2 * USD 0,20 = USD 0,40

Cobranças por computação enquanto a Simultaneidade provisionada está habilitada:
O preço da computação é USD 0,0000097222 por GB-s
Duração total da computação (segundos) = 500.000 * 100ms = 50.000 segundos
Computação total (GB/s) = 50.000 segundos * 1536 MB/1024 MB = 75.000 GB/s.
Cobranças totais de computação = 75.000 GB/s * USD 0,0000097222 = USD 0,73

Cobranças de computação enquanto a Simultaneidade provisionada está desabilitada:
O preço mensal de computação é de USD 0,0000166667 por gigabyte por segundo e o nível gratuito oferece 400.000 GB por segundo.
Computação total (segundos) = 2,5 M * 120 ms = 300.000 segundos
Computação total (GB/s) = 300.000 * 1536 MB/1024 MB = 450.000 GB/s
Cálculo total − cálculo do nível gratuito = cálculo mensal de GB/s faturáveis
450.000 GB/s − 400.000 GB/s do nível gratuito = 50.000 GB/s
Cobrança mensal de computação = 50.000 * USD 0,0000166667 = USD 0,83

Total de cobranças mensais:
Cobranças totais = Cobranças de simultaneidade provisionada + Cobranças de solicitação + Cobranças de computação enquanto a Simultânea provisionada está habilitada + Cobranças de computação enquanto a Simultânea provisionada está desabilitada
Cobrança total = USD 18 + USD 0,40 + USD 0,73 + USD 0,83 = USD 19,96
Exemplo 2: Encaminhamento de clientes para o conteúdo da solução de suporte mais relevante durante a Cyber Monday

Vamos supor que você seja um varejista que realiza uma grande venda durante a Cyber Monday, um feriado de comércio eletrônico que ocorre na segunda-feira após o Dia de Ação de Graças nos Estados Unidos. Seus clientes podem conversar ao vivo com o suporte ao cliente através do aplicativo móvel que você fornece. Você decide implantar um modelo de processamento de linguagem natural (PNL).

Vamos supor que você seja um varejista que realiza uma grande venda durante a Cyber Monday, um feriado de comércio eletrônico que ocorre na segunda-feira após o Dia de Ação de Graças nos Estados Unidos. Seus clientes podem conversar ao vivo com o suporte ao cliente através do aplicativo móvel que você fornece. Você decide implantar um modelo de processamento de linguagem natural (PNL).

Nesse caso, você está usando o popular modelo Bidirectional Encoder Representations from Transformers (BERT) no AWS Lambda. O modelo ajuda você a analisar e entender as interações de atendimento ao cliente por meio do aplicativo móvel para exibir conteúdo de suporte relevante ou encaminhar o cliente para o agente de atendimento ao cliente apropriado. Você receberá muito mais consultas de suporte ao cliente durante essa venda do que o normal, então decide ativar a Simultaneidade provisionada em suas funções do Lambda para que sua aplicação responda rapidamente, mesmo com picos de tráfego.

Vamos supor que suas funções recebam dois milhões de solicitações durante as 24 horas do evento de venda, enquanto a Simultaneidade provisionada está habilidata. A duração média da execução da função é de 280 ms. Você configura sua função com 4.096 MB de memória em um processador baseado em x86 e define a Simultaneidade provisionada em sete.

A cobrança seria calculada da seguinte forma:

Cobranças pela Simultaneidade provisionada:
O preço da simultaneidade provisionada é de USD 0,0000041667 por GB-s.
Período total de tempo para o qual a Simultaneidade provisionada está habilitada (segundos) = 24 horas * 3.600 segundos = 86.400 segundos
Simultaneidade total configurada (GB): 7 * 4096 MB/1024 MB = 28 GB
Valor total da simultaneidade provisionada (GB-s) = 28 GB * 86.400 segundos = 2.419.200 GB-s
Cobranças de Simultaneidade provisionada = 2.419.200 GB/s * USD 0,0000041667 = USD 10,08

Cobranças por computação enquanto a Simultaneidade provisionada está habilitada:
O preço da computação é USD 0,0000097222 por GB-s.
Duração total da computação (segundos) = 2.000.000 * 280 ms = 560.000 segundos
Computação total (GB-/) = 560.000 segundos * 4096 MB/1024 MB = 2.240.000 GB/s.
Cobranças totais de computação = 2.240.000 GB-s * USD 0,0000097222 = USD 21,78

Cobranças mensais de solicitações:
O preço mensal de solicitações é USD 0,20 por 1 milhão de solicitações
Cobrança de solicitações mensais = 2 milhões * USD 0,2/milhão = USD 0,40

Total de cobranças mensais:
Cobranças totais = Cobranças de simultaneidade provisionada + Cobranças de computação enquanto a simultaneidade provisionada está habilitada + Cobranças de solicitação = USD 10,08 + USD 21,78 + USD 0,40 = USD 32,26

Preço do SnapStart

O SnapStart pode melhorar o desempenho da inicialização de alguns segundos para menos de um segundo para aplicações sensíveis à latência. O SnapStart funciona capturando o estado da memória (e do disco) inicializados da sua função e armazenando esse snapshot em cache para acesso de baixa latência. Quando sua função é invocada posteriormente, o Lambda retoma os ambientes de execução nesse snapshot pré-inicializado em vez de inicializá-los do zero, melhorando a latência da inicialização.

Um snapshot é criado sempre que você publica uma nova versão da sua função com o SnapStart ativado. Sim, haverá uma cobrança pelo armazenamento em cache de um snapshot durante o período em que sua versão da função estiver ativa, por no mínimo 3 horas e por milissegundo depois disso. O preço depende da quantidade de memória que você alocar para a função. Você também é cobrado toda vez que o Lambda retoma um ambiente de execução restaurando seu snapshot, com o preço dependendo da quantidade de memória alocada para sua função.

Os preços do SnapStart não se aplicam aos runtimes gerenciados por Java com suporte.

Exemplo de preço: enriquecer a telemetria de streaming com metadados adicionais

Vamos supor que você seja uma empresa de logística com uma frota de veículos em campo, cada um deles habilitado com sensores e conectividade 4G/5G para emitir dados de telemetria em um Amazon Kinesis Data Stream. Você deseja usar modelos de machine learning (ML) desenvolvidos para inferir a integridade do veículo e prever quando a manutenção de componentes específicos pode ser necessária.

Suponha que você tenha 10.000 veículos em campo, cada um emitindo telemetria uma vez por hora de forma escalonada com instabilidade suficiente. Você pretende realizar essa inferência em cada carga útil para garantir que os veículos sejam agendados prontamente para manutenção e garantir a saúde ideal da sua frota de veículos.

Suponha que o modelo de ML esteja empacotado junto com a função e tenha 512 MB de tamanho. Para inferência, você configurou a função com 1 GB de memória, e a duração da execução cobrada é de dois segundos em média em um processador baseado em um x86. Você mantém uma única versão da sua função. Para simplificar, vamos supor que 1% de todas as solicitações resultem na criação de novos ambientes de execução.

Você percebe que o processamento de ponta a ponta leva vários segundos para esse 1% das solicitações. Isso é causado pela inicialização da função que leva vários segundos, porque você importa grandes módulos de software e o modelo de ML durante a inicialização. Você quer reduzir o tempo de processamento de ponta a ponta dessas solicitações, então habilite o SnapStart na função e publique uma nova versão.

A cobrança seria calculada da seguinte forma:

Cobrança de solicitação
Por mês, os veículos emitirão 10.000 x 24 x 31 = 7.440.000 mensagens, que serão processadas pela função do Lambda.

Cobranças mensais de solicitação → 7,44 milhões x USD 0,20/milhão = USD 1,49

Cobranças mensais por computação
Por mês, as funções serão executadas uma vez por mensagem por dois segundos.

Duração mensal da computação (segundos): 7,44 milhões x 2 segundos = 14,88 milhões de segundos
Computação mensal (GB-s): 14,88 milhões de segundos x 1024 MB/1024 MB = 14,88 milhões GB-s
Cobranças mensais de computação: 14,88 milhões de GB-s x USD 0,0000166667 = USD 248

Cobranças do SnapStart:

Período total durante o qual a versão da função está ativa (segundos): 24 horas x 31 dias x 3600 segundos = 2.678.400 segundos
Memória de função alocada: 1024 MB/1024 MB -> 1 GB
Cache SnapStart total usado: 1 GB x 2.678.400 s -> 2.678.400 GB-S
Cobranças do SnapStart Cache: 2,68 milhões de GB/s x 0,0000015046 = USD 4,03

Número de solicitações usando o SnapStart Restore: 1% de 7,44 milhões = 74.400
Total de restauração do SnapStart usada: 74.400 x 1 GB = 74.400 GB
Cobranças do SnapStart Restore: 74.400 GB x 0,0001397998 USD = USD 10,4

Total de cobranças do SnapStart: cobranças do SnapStart Cache + cobranças do SnapStart Restore
Total de cobranças do SnapStart: USD 4,03 + USD 10,4 = USD 14,43

Cobranças totais por mês

Cobranças totais mensais = cobranças de solicitação + cobranças de computação + cobranças do SnapStart
Cobranças totais = USD 1,49 + USD 248,00 + USD 14,43 = USD 263,92

Preços de transmissão de respostas HTTP do Lambda

As funções do AWS Lambda podem retornar uma transmissão de respostas HTTP quando invocadas por meio da API InvokeWithResponseStream ou por meio de uma URL de função usando o modo de invocação ResponseStream. A transmissão de respostas HTTP pode melhorar a performance de Tempo até o primeiro byte e oferece suporte para cargas maiores que 6 MB. Ao usar a transmissão de respostas HTTP, cobranças são aplicáveis para cada GB gravado na transmissão de respostas pela sua função. Você pode transmitir os primeiros 6 MB por solicitação sem custos.

Todos os exemplos a seguir são baseados em preços no Leste dos EUA (Norte da Virgínia).

Exemplo de preço: conteúdo da Web renderizado no lado do servidor de transmissão

Vamos supor que você seja um desenvolvedor de aplicações Web e esteja criando um site renderizado no lado do servidor em uma função do Lambda. Sua função do Lambda gera conteúdo HTML dinamicamente com base na solicitação e nos resultados de várias chamadas de serviços downstream. Algumas dessas chamadas podem demorar muito tempo para retornar uma resposta. Para otimizar a experiência de carregamento de páginas dos seus usuários, você usa os recursos de transmissão de respostas HTTP do Lambda para melhorar a performance de Tempo até o primeiro byte, renderizando os primeiros blocos de HTML no navegador assim que sua função os gera.

Para simplificar, vamos supor que sua aplicação processe três milhões de solicitações por mês. Suponhamos também que você tenha esgotado os 100 GB de transmissão de respostas incluídos no nível gratuito da AWS. A duração média da função é de 500 ms. Você configurou sua função com 1536 MB de memória, em um processador baseado em x86. O tamanho médio da carga útil por solicitação é 100 KB para os primeiros dois milhões de solicitações por mês e 7 MB para os últimos milhões de solicitações por mês. O exemplo de cálculo pressupõe que 1 GB = 1.024 MB.

A cobrança seria calculada da seguinte forma:

Cobranças mensais por computação
O preço mensal de computação é de USD 0,0000166667 por gigabyte por segundo e o nível gratuito oferece 400.000 GB por segundo.
Computação total (segundos) = 3 milhões * 500 ms = 1.500.000 segundos
Computação total (GB/s) = 1.500.000 * 1536 MB/1024 MB = 2.250.000 GB/s
Cálculo total − Cálculo do nível gratuito = cálculo mensal de GB/s faturáveis
2.250.000 GB/s − 400.000 GB/s do nível gratuito = 1.850.000 GB/s
Cobrança mensal de computação = 1.850.000 * USD 0,0000166667 USD = USD 30,83

Cobrança mensal de solicitações
O preço da solicitação mensal é de USD 0,20 por milhão de solicitações e o nível gratuito fornece um milhão de solicitações por mês.
Solicitações totais − solicitações do nível gratuito = solicitações mensais faturáveis
3 milhões de solicitações – 1 milhão de solicitações de nível gratuito = 2 milhões de solicitações faturáveis mensais
Cobrança de solicitações mensais = 2 milhões * USD 0,2/milhão = USD 0,40

Cobranças de bytes processados
O preço mensal de bytes transmitidos é de USD 0,008 por GB transmitido, e o nível gratuito oferece 100 GB por mês. Os primeiros 6 MB transmitidos por solicitação também são gratuitos.
Bytes livres transmitidos (GB) = 2 milhões de solicitações * 100 KB = 190,7 GB
Como 100 KB < 6 MB por solicitação, os 190,7 GB transmitidos são gratuitos.
Bytes cobráveis transmitidos (GB) = 1 milhão de solicitações * (7 MB – 6 MB) = 976,56 GB
Cobranças mensais de bytes transmitidos = 976,56 GB * USD 0,008 = USD 7,81

Total de cobranças mensais:
Total de cobranças = Cobranças de computação + Cobranças de solicitações + Cobranças por bytes transmitidos = USD 30,83 + USD 0,40 + USD 7,81 = USD 39,04 por mês

Preços do modo provisionado para mapeamento da origem do evento (ESM)

O modo provisionado do ESM permite que você otimize o throughput do seu ESM alocando um número mínimo e máximo de recursos chamados de sondadores de eventos e escalando automaticamente entre os limites mínimo e máximo configurados. Um agente de sondagem de eventos é o recurso configurável que sustenta um ESM no modo provisionado. O preço é baseado nos agentes de sondagem de eventos mínimos provisionados e nos agentes de sondagem de eventos consumidos durante o ajuste de escala automático. As cobranças são calculadas usando uma unidade de cobrança chamada de EPU (Unidade de agente de sondagem de eventos). Você paga pelo número e pela duração das EPUs usadas, medidas em horas de Unidades de agente de sondagem de eventos.

ESM do SQS: uma EPU suporta um agente de sondagem de eventos, cada um fornecendo até 1 MB/s de throughput. Cada ESM do SQS exige no mínimo 2 agentes de sondagem de eventos.

ESM do MSK ou do Kafka autogerenciado (SMK): cada EPU suporta uma capacidade de throughput de até 20 MB/s para sondagem de eventos, com um padrão de 10 agentes de sondagem de eventos. Cada agente de sondagem de eventos pode aumentar a escala verticalmente até um throughput de 5 MB/s. O número de agentes de sondagem de eventos alocados em uma EPU depende da capacidade de computação consumida por cada agente de sondagem de eventos. Você pode agrupar vários ESMs na mesma Amazon VPC para compartilhar a capacidade e os custos da EPU. Para saber mais sobre o modo provisionado do ESM do Kafka, leia a documentação.

Transferência de dados: você será cobrado pelas taxas de transferência de dados da AWS padrão.

Duração: o preço é calculado por segundo com no mínimo 1 minuto.

Exemplo de preço 1:

Exemplo: análise de dados de streaming em tempo real usando Kafka

Exemplo: análise de dados de streaming em tempo real usando Kafka

Suponha que você seja um fornecedor global de soluções de central de atendimento com clientes e tenha pipelines que emitem metadados relacionados à experiência de chamada para tópicos do Amazon MSK (Kafka) para análise em tempo real. Como o tráfego pode ser intenso e imprevisível, você deseja usar o modo provisionado para ESM para ajustar a performance do seu ESM. Suponha que sua função do Lambda que processa essas mensagens esteja configurada com 1.024 MB de memória para o processador x86 e receba 1 milhão de invocações por dia com duração média de 2 segundos. Suponha que você tenha ativado o modo provisionado para seu ESM com o pesquisador de 1 evento padrão e seu ESM tenha a escala aumentada verticalmente para consumir 800 horas de EPU por mês no Leste dos EUA (Norte da Virgínia).

Cobranças mensais por computação
O preço mensal calculado é de USD 0,0000166667 por GB-s e o nível gratuito oferece 400.000 GB/s
Cálculo total (segundos) = 1.000.000 * 30 * 2 segundos = 60.000.000 segundos
Computação total (GB/s) = 60.000.000 * 1024 MB/1024 = 60.000.000 GB/s
Cálculo total − Cálculo do nível gratuito = cálculo mensal de GB/s faturáveis
60.000.000 GB/s − 400.000 GB/s do nível gratuito = 59.600.000 GB/s
Cobrança mensal de computação = 59.600.000 * USD 0,0000166667 = USD 993,3

Cobranças mensais de solicitações
O preço mensal de solicitações é USD 0,20 por 1 milhão de solicitações.
Cobranças mensais por solicitações = 60 milhões de solicitações * USD 0,20 = USD 12,00

Modo provisionado mensalmente para cobranças de ESM
Cobranças de EPU = 800 horas de EPU * USD 0,185 = USD 148
Modo provisionado mensalmente para cobranças de ESM = USD 148

Cobranças totais
Cobranças totais = cobranças por computação + cobranças por solicitação + cobranças por modo provisionado para ESM
Cobranças totais = USD 993,30 + USD 12 + USD 148 = USD 1.153,30

Exemplo de preço 2

Processamento de eventos em tempo real usando o Amazon SQS

Exemplo: processamento de eventos em tempo real usando o Amazon SQS

Suponha uma empresa de serviços financeiros que processa feeds de dados de mercado e executa transações financeiras usando microsserviços orientados a eventos para aplicações financeiras voltadas para o cliente em tempo real. Como o tráfego pode ser irregular e imprevisível, é recomendável usar o Modo provisionado para ESM do SQS para ajustar a performance do seu ESM. Suponha que a sua função do Lambda que processa esses eventos esteja configurada com 1.024 MB de memória para o processador x86 e receba 1 milhão de invocações por dia com duração média de 1 segundo. Você tem um TPS máximo de 100 eventos que deseja processar com uma latência máxima de 0,2 segundos. Para alcançar essa performance de latência, você ativou o modo Provisionado para o seu ESM do SQS com 10 agentes de sondagem de eventos mínimos, e seu ESM possui escalabilidade para consumir 8.000 horas EPU por mês na região Leste dos EUA (Norte da Virgínia) para lidar com o tráfego de baixa latência.

Cobranças mensais por computação
O preço mensal de computação é USD 0,0000166667 por GB/s
Computação total (segundos) = 1.000.000 * 30 * 1 segundos = 30.000.000 segundos
Computação total (GB/s) = 30.000.000 * 1024 MB/1024 = 30.000.000 GB/s
Computação total = GB/s de computação mensal faturável * USD 0,0000166667
Cobrança mensal de computação = 30.000.000 * USD 0,0000166667 = USD 500

Cobrança mensal de solicitações
O preço mensal de solicitações é USD 0,20 por 1 milhão de solicitações
Cobranças mensais por solicitações = 30 milhões de solicitações * USD 0,20 = USD 6

Modo provisionado mensal para cobranças de ESM do SQS
O preço da EPU é de USD 0,00925 por hora de EPU
Cobranças de EPU = 8000 horas de EPU * USD 0,00925 = USD 74
Modo provisionado mensal para cobranças de ESM = USD 74

Cobranças totais
Cobranças totais = Cobranças por computação + Cobranças por solicitação + Cobranças por modo provisionado para ESM
Cobranças totais = USD 500 + USD 6 + USD 74 = USD 580

Exemplo de preço 3

Exemplo: análise de dados em tempo real usando vários ESMs do Kafka

Suponha um fornecedor global de soluções de central de contatos com pipelines que emitem metadados relacionados à experiência de chamadas para dezenas de tópicos do Amazon MSK (Kafka), cada um deles recebendo mensagens de diversos produtos. Cada tópico está ingerindo no máximo 500 mensagens por segundo, com tamanho médio de mensagem de 3 KB e throughput máximo de 1,5 MB/s. Como o tráfego pode ser intenso e imprevisível, você deseja usar o modo provisionado para ESM para ajustar a performance do seu ESM. Suponha que sua função do Lambda que processa essas mensagens esteja configurada com 1.024 MB de memória para o processador x86 e receba 1 milhão de invocações por dia com duração média de 0.2 segundos. Você criou 10 ESMs do Kafka para processamento de eventos com <1,5 MB/s de throughput por ESM, que decidiu agrupar no mesmo grupo de agente de sondagem para otimizar os custos. Suponha que você tenha ativado o Modo provisionado para o seu ESM com o agente de sondagem de eventos padrão 1 e esteja usando todos os seus 10 ESMs no mesmo grupo de agentes de sondagem na região Leste dos EUA (Norte da Virgínia).

Cobranças mensais por computação
O preço mensal calculado é de USD 0,0000166667 por GB/s, e o nível gratuito oferece 400.000 GB/s.
Computação total (segundos) = 1.000.000 * 30 * 0,2 segundos = 6.000.000 segundos
Computação total (GB/s) = 6.000.000 * 1024 MB/1024 = 6.000.000 GB/s
Computação total (GB/s) para todos os 10 ESMs = 6.000.000 GB/s * 10 = 60.000.000 GB/s
Cobrança mensal de computação = 60.000.000 * USD 0,0000166667 = USD 1.000
Cobranças mensais de solicitações
O preço mensal de solicitações é USD 0,20 por 1 milhão de solicitações.
Total de solicitações mensais para todos os 100 ESMs = 1 milhão * 30 dias * 10 ESMs = 300 milhões de solicitações
Cobranças mensais por solicitações = 300 milhões de solicitações * USD 0,20 = USD 60,00
Modo provisionado mensal para cobranças de ESM
O preço por hora de EPU é USD 0,185 por hora e suporta 10 agentes de sondagem de eventos por EPU.
Total de agentes de sondagem de eventos por hora = 1 agente de sondagem de eventos * 10 ESMs = 10 agentes de sondagem de eventos
EPU usada = 10 agentes de sondagem de eventos usados/10 agentes de sondagem de eventos suportados por EPU = 1 EPU
Total de EPUs por mês = 1 EPU * 720 horas por mês = 720 EPU/horas
Cobranças por EPU = 720 horas de EPU * USD 0,185 = USD 133,2
Modo provisionado mensal para cobranças de ESM = USD 133,2
Cobranças totais
Cobranças totais = cobranças por computação + cobranças por solicitação + cobranças por modo provisionado para ESM
Cobranças totais = USD 1.000 + USD 60 + USD 133,2 = USD 1.193,2 por mês para 10 ESMs
Custos mensais por ESM = USD 1.193,2/10 = USD 119,3 por mês por ESM

Transferência de dados e outras cobranças

Transferência de dados
Os dados transferidos “para dentro” e “para fora” das suas funções do AWS Lambda, de fora da região em que a função executou, serão cobrados de acordo com as taxas de transferência de dados do Amazon EC2, conforme listado em "Transferência de dados”.

A transferência de dados com funções do AWS Lambda é gratuita na mesma região da AWS entre os seguintes serviços: Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) e Amazon SimpleDB.

O uso da Amazon Virtual Private Cloud (VPC) ou do emparelhamento de VPC, com funções do AWS Lambda, resultará em cobranças adicionais, conforme explicado na página de definição de preço sob demanda do Amazon Elastic Compute Cloud (EC2). Uma conexão de emparelhamento de VPC é uma conexão de rede entre duas VPCs que permite direcionar o tráfego entre elas usando endereços IPv4 ou IPv6 privados.

Cobranças adicionais

Você pode incorrer em cobranças adicionais se a sua função do Lambda utiliza outros serviços da AWS ou transfere dados. Por exemplo, se a função do Lambda lê e grava dados no Amazon S3, você será cobrado pelas solicitações de leitura e gravação e pelos dados armazenados no Amazon S3.

Para obter mais detalhes sobre a definição de preço dos serviços da AWS, consulte a seção de definição de preço das páginas de detalhes relevantes dos serviços da AWS.

Preço do Lambda@Edge

As funções Lambda@Edge são medidas com uma granularidade de 1 ms

Exemplo de preços:

Se a função Lambda@Edge executou 10 milhões de vezes em um mês, e executou durante 10 ms a cada vez, a cobrança seria calculada da seguinte forma:

Se a função Lambda@Edge executou 10 milhões de vezes em um mês, e executou durante 10 ms a cada vez, a cobrança seria calculada da seguinte forma:

Cobranças mensais por computação

O preço mensal de computação é de 0,00000625125 USD por 128 MB-segundo

Total de computação (segundos) = 10M * (0,01 seg.) = 100.000 segundos

Cobrança mensal de computação = 100.000 * 0,00000625125 USD = 0,63 USD

Cobrança mensal de solicitações

O preço mensal de solicitações é 0,60 USD por 1 milhão de solicitações.

Cobrança mensal de solicitações = 10 milhões * 0,6 USD/milhão = 6 USD

Total de cobranças mensais

Cobranças totais = cobrança de computação + cobrança de solicitações = USD 0,63 + USD 6 = USD 6,63 por mês

Recursos adicionais de preço

Calculadora de preços da AWS

Calcule facilmente os custos mensais na AWS

Obtenha assistência de preços

Entre em contato com os especialistas da AWS para obter um orçamento personalizado

Conceitos básicos do AWS Lambda

Atributo

Descubra como o AWS Lambda funciona

Explore os atributos do AWS Lambda

Documentação

Conheça o treinamento prático

Confira os tutoriais de primeiros passos

Conceitos básicos

Fale com um especialista

Conheça as opções de suporte

AWS Lambda – Definição de preço

Visão geral

Calculadora de preços da AWS

Preço do AWS Lambda

Lambda Managed Instances

Exemplo de preço: serviço de API de alto throughput

Preço das funções duráveis do Lambda

Exemplo de preços:

Cobranças mensais por computação

Cobranças mensais de solicitação

Cobranças mensais de funções duráveis

Cobranças mensais totais

Preços do isolamento de locatários

Exemplo de preços:

Preço do armazenamento temporário do Lambda

Exemplo 1: Backend de aplicações móveis

Exemplo 2: Enriquecendo a telemetria de streaming com metadados adicionais

Exemplo 3: Executar ML em tíquetes de suporte ao cliente e interações para melhorar a experiência do cliente

Preço da simultaneidade provisionada

Exemplo 1: Lançamento do aplicação móvel

Exemplo 2: Encaminhamento de clientes para o conteúdo da solução de suporte mais relevante durante a Cyber Monday

Preço do SnapStart

Exemplo de preço: enriquecer a telemetria de streaming com metadados adicionais

Preços de transmissão de respostas HTTP do Lambda

Exemplo de preço: conteúdo da Web renderizado no lado do servidor de transmissão

Preços do modo provisionado para mapeamento da origem do evento (ESM)

Exemplo de preço 1:

Exemplo de preço 2

Exemplo de preço 3

Transferência de dados e outras cobranças

Preço do Lambda@Edge

Exemplo de preços:

Recursos adicionais de preço

Conceitos básicos do AWS Lambda

Descubra como o AWS Lambda funciona

Conheça o treinamento prático

Fale com um especialista

Aprenda

Recursos

Desenvolvedores

Ajuda