Precios de AWS Lambda

El costo de la duración depende del volumen de memoria asignado a la función. Puede asignar a la función cualquier volumen de memoria desde 128 MB a 10 240 MB en incrementos de 1 MB. La siguiente tabla contiene algunos ejemplos del precio por 1 ms asociado con diferentes tamaños de memoria para el uso que se encuentra dentro del primer nivel de precios, por ejemplo, hasta 6 mil millones de GB/segundo por mes en la región Este de EE. UU. (Ohio).

  • Precio de x86
  • Precio de Arm

Los niveles de precios de duración bajo demanda de Lambda se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura (x86 o Arm, respectivamente), en la misma región y dentro de la cuenta. Si utiliza la facturación unificada en AWS Organizations, los niveles de precios se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura, en la misma región y en todas las cuentas de la organización.

Precios del almacenamiento efímero de Lambda

Los costos del almacenamiento efímero dependen de la cantidad de almacenamiento efímero que se asigne a la función y de la duración de ejecución de la función, medida en milisegundos. Puede asignar a la función cualquier cantidad adicional de almacenamiento entre 512 MB y 10 240 MB en incrementos de 1 MB. Puede configurar el almacenamiento efímero para las funciones que se ejecutan en arquitecturas x86 y Arm. Para cada función de Lambda, están disponibles 512 MB de almacenamiento efímero sin costo adicional. Solo paga por el almacenamiento efímero adicional que configure.

Todos los ejemplos que se muestran a continuación se basan en el precio de la región Este de EE. UU. (Norte de Virginia).

  • Supongamos que es un desarrollador de aplicaciones móviles que crea una aplicación para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.

    Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria en un procesador basado en x86. Los cargos se calcularían de la siguiente manera:

    Cargos mensuales por informática

    El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 3 millones * 120 ms = 360 000 segundos
    Capacidad informática total (GB/s) = 360 000 * 1536 MB/1024 MB = 540 000 GB/s
    Informática total – informática en el nivel gratuito = GB-s de informática facturable al mes
    540 000 GB-s – 400 000 GB-s en el nivel gratuito = 140 000 GB-s
    Cargos mensuales por informática =
    140 000 * 0,0000166667 USD = 2,33 USD

    Cargos de solicitudes mensuales

    El precio mensual por solicitudes es de 0,20 USD por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
    3 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 millones de solicitudes mensuales facturables
    Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USD

    Cargos mensuales totales

    Cargos totales = cargos por informática + cargos por solicitudes = 2,33 USD + 0,40 USD = 2,73 USD al mes

  • Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en un flujo de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.

    Supongamos que hay 10 000 vehículos en el sitio, cada uno de los cuales emite telemetría una vez por hora de forma escalonada con suficiente fluctuación. Pretende llevar a cabo esta inferencia en cada carga para asegurarse de que los vehículos están programados puntualmente para el mantenimiento y garantizar el estado óptimo de su flota.

    Supongamos que el modelo de ML está empaquetado junto con la función y tiene un tamaño de 512 MB. Para la inferencia, ha configurado su función con 1 GB de memoria y la ejecución de la función tarda una media de 2 segundos en completarse en un procesador basado en x86.

    Cargos de solicitudes mensuales:
    Al mes, los vehículos emitirán 10 000 * 24 * 31 = 7 440 000 mensajes que serán procesados por la función Lambda.

    Cargos de solicitudes mensuales → 7,44 millones * 0,20 USD por millón = 1,488 USD ~= 1,49 USD

    Cargos mensuales por informática:
    Al mes, las funciones se ejecutarán una vez por mensaje durante 2 segundos.

    Duración mensual de informática (segundos) → 7,44 millones * 2 segundos = 14,88 millones de segundos
    Informática mensual (GB-s) → 14,88 millones de segundos * 1024 MB/1024 MB = 14,88 GB-s
    Cargos mensuales por informática → 14,88 millones de GB-s * 0,0000166667 USD = 248,00 USD

    Cargos mensuales totales:
    Cargos mensuales totales = cargos por solicitudes + cargos por informática = 1,49 USD + 248,00 USD = 249,49 USD

  • Supongamos que es una empresa de servicios financieros que desea conocer mejor sus principales problemas de atención al cliente. Su objetivo es mejorar la experiencia del cliente y reducir la pérdida de clientela. Los clientes pueden conversar en directo con el personal de atención al cliente a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).

    En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o derivar al cliente al agente de atención adecuado. El número de consultas de asistencia que procesa su modelo de inferencia varía mucho a lo largo de la semana.

    Supongamos que sus funciones que ejecutan el modelo de inferencia reciben 6 millones de solicitudes al mes. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86.

    También configura la función para que utilice 2048 MB de almacenamiento efímero.

    Los cargos se calcularían de la siguiente manera:

    Cargos mensuales por informática:
    El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
    Informática total (GB-s) = 1 680 000 * 4096 MB/1024 MB = 6 720 000 GB-s
    Informática total – informática en el nivel gratuito de AWS = GB-s de informática facturable al mes
    6 720 000 GB-s – 400 000 GB-s en el nivel gratuito = 6 320 000 GB-s
    Cargos mensuales por informática = 6 320 000 * 0,0000166667 USD = 105,33 USD

    Cargos mensuales por solicitudes:
    El precio mensual por solicitudes es de 0,20 USD por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
    6 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 5 millones de solicitudes mensuales facturables
    Cargos mensuales por solicitudes = 5 millones * 0,2 USD por millón = 1 USD

    Cargos mensuales por almacenamiento efímero:
    El precio mensual por almacenamiento efímero es de 0,0000000309 USD por cada GB/segundo y Lambda ofrece 512 MB de almacenamiento sin costo adicional.
    Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
    Almacenamiento efímero total facturable = 2048 MB – 512 MB = 1536 MB
    Almacenamiento efímero total (GB-s) = 1 680 000 * 1536 MB/1024 MB = 2 520 000 GB-s
    Cargos mensuales por almacenamiento efímero = 2 520 000 * 0,0000000309 USD = 0,08 USD

    Cargos mensuales totales:
    Cargos totales = cargos por informática + cargos por solicitudes = 105,33 USD + 1 USD + 0,08 USD = 106,41 USD al mes

Precios de la simultaneidad aprovisionada

Para tener mayor control sobre el rendimiento de sus aplicaciones sin servidor, habilite la simultaneidad aprovisionada para sus funciones Lambda. Cuando se habilita, la simultaneidad aprovisionada mantiene las funciones activadas y en el mayor estado de preparación para responder en milisegundos de dos dígitos. Paga por la cantidad de simultaneidad que configura y por el periodo por el que lo hace. Cuando la simultaneidad aprovisionada está habilitada y se ejecuta para su función, también paga por las solicitudes y por la duración en función de los precios que se muestran a continuación. Si la función excede la que figura en su configuración, se le cobrará por la ejecución de las funciones excedentes según las tarifas que figuran en la sección anterior Precios de AWS Lambda. Puede activar la simultaneidad aprovisionada para las funciones que se ejecutan en las arquitecturas x86 y Arm. Para obtener más información sobre la simultaneidad aprovisionada, consulte la documentación.

La simultaneidad aprovisionada se calcula desde el momento en que la habilita para su función hasta que la desactiva y se redondea a los 5 minutos más cercanos. El precio depende del volumen de memoria que asigne a su función y la cantidad de simultaneidad que configure. La duración se calcula a partir del momento en que el código comienza a ejecutarse hasta que regresa o finaliza de algún modo, y se redondea al 1 ms más cercano**. El precio depende del volumen de memoria asignado a la función.

** Los cargos de duración se aplican al código que se ejecuta en el gestor de una función, así como al código de inicialización que se declara fuera del gestor. En el caso de las funciones de Lambda con extensiones de AWS Lambda, la duración también incluye el tiempo que tarda el código de la última extensión en ejecución en terminar de ejecutarse durante la fase de cierre. Para las funciones configuradas con simultaneidad aprovisionada, AWS Lambda recicla periódicamente los entornos de ejecución y repite el código de inicialización. Para obtener más detalles, revise la documentación del modelo de programación de Lambda.

No se aplicará el nivel gratuito de Lambda a las funciones que tengan habilitada la simultaneidad aprovisionada. Si habilita la simultaneidad aprovisionada en una función y luego la ejecuta, se le cobrará por las solicitudes y por la duración en función de los precios que se muestran a continuación.

Todos los ejemplos que se muestran a continuación se basan en el precio de la región EE. UU. Este (Norte de Virginia).

  • Supongamos que es un desarrollador de aplicaciones móviles y crea una aplicación móvil para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda de su aplicación, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.

    Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La
    duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria, en un procesador basado en x86.

    Va a hacer el lanzamiento de la nueva versión de su aplicación móvil, que ha comercializado intensamente. Espera un pico en la demanda durante el día del lanzamiento, desde el mediodía hasta las 8 de la tarde. Quiere que su aplicación móvil tenga capacidad de respuesta incluso cuando la demanda aumenta y disminuye rápidamente, por lo que habilita la simultaneidad aprovisionada en sus funciones Lambda. Establece la simultaneidad aprovisionada en 100.

    Durante esas ocho horas, sus funciones recibieron 500 000 solicitudes. La duración media
    de ejecución de la función mientras la simultaneidad aprovisionada está habilitada es de 100 ms. Durante el resto del mes, su aplicación recibe las 2,5 millones de solicitudes adicionales y las funciones se ejecutan en respuesta a ellas sin que esté habilitada la simultaneidad aprovisionada.

    Los cargos se calcularían de la siguiente manera:

    Cargos por simultaneidad aprovisionada:
    El precio de la simultaneidad aprovisionada es de 0,0000041667 USD por cada GB-s
    Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 8 horas = 3600 segundos = 28 800 segundos
    Simultaneidad configurada total (GB): 100 * 1536 MB/1024 MB = 150 GB
    Cantidad total de simultaneidad aprovisionada (GB-s) = 150 GB * 28 800 segundos = 4 320 000 GB-s
    Cargos por simultaneidad aprovisionada: 4,32 millones de GB-s * 0,0000041667 USD = 18 USD

    Cargos por solicitudes:
    El precio mensual por solicitudes es de 0,20 USD por cada millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – solicitudes en el nivel gratuito = solicitudes facturables al mes
    3 000 000 de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 000 000 de solicitudes facturables al mes
    Cargos de solicitudes mensuales = 2 * 0,20 USD = 0,40 USD

    Cargos por informática cuando la simultaneidad aprovisionada está habilitada:
    El precio de la informática es de 0,0000097222 USD por GB-s
    Duración total de informática (segundos) = 500 000 * 100 ms = 50 000 segundos
    Informática total (GB-s) = 50 000 segundos * 1536 MB/1024 MB = 75 000 GB-s.
    Cargos totales por informática = 75 000 GB-s * 0,0000097222 USD = 0,73 USD

    Cargos por informática cuando la simultaneidad aprovisionada está desactivada:
    El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 2,5 millones * 120 ms = 300 000 segundos
    Informática total (GB-s) = 300 000 * 1536 MB/1024 MB = 450 000 GB-s
    Informática total – informática en el nivel gratuito = GB-s de informática facturable al mes
    450 000 GB-s – 400 000 GB-s en el nivel gratuito = 50 000 GB-s
    Cargos mensuales por informática = 50 000 * 0,0000166667 USD = 0,83 USD

    Cargos mensuales totales:
    Cargos totales = cargos de simultaneidad aprovisionada + cargos por solicitud + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por informática cuando la simultaneidad aprovisionada está desactivada
    Cargos totales = 18 USD + 0,40 USD + 0,73 USD + 0,83 USD = 19,96 USD

  • Supongamos que es un minorista que lleva a cabo una gran venta durante Cyber Monday, una fiesta del comercio electrónico que tiene lugar el lunes después de Acción de Gracias en Estados Unidos. Sus clientes pueden conversar en directo con el servicio de asistencia a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).

    En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o dirigir al cliente con el agente de atención adecuado. Durante esta venta recibirá muchas más consultas de asistencia al cliente de lo habitual, por lo que decide habilitar simultaneidad aprovisionada en sus funciones Lambda para que la aplicación responda rápidamente incluso cuando experimente picos de tráfico.

    Supongamos que sus funciones reciben dos millones de solicitudes durante las 24 horas del evento de venta, mientras la simultaneidad aprovisionada está habilitada. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86 y se estableció la simultaneidad aprovisionada en siete.

    Los cargos se calcularían de la siguiente manera:

    Cargos por simultaneidad aprovisionada:
    El precio de la simultaneidad aprovisionada es de 0,0000041667 USD por cada GB-s.
    Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 24 horas = 3600 segundos = 86 400 segundos
    Simultaneidad configurada total (GB): 7 * 4096 MB/1024 MB = 28 GB
    Cantidad total de simultaneidad aprovisionada (GB-s) = 28 GB * 86 400 segundos = 2 419 200 GB-s
    Cargos por simultaneidad aprovisionada = 2 419 200 GB-s * 0,0000041667 USD = 10,08 USD

    Cargos por informática cuando la simultaneidad aprovisionada está habilitada:
    El precio de la informática es de 0,0000097222 USD por GB-s.
    Duración total de informática (segundos) = 2 000 000 * 280 ms = 560 000 segundos
    Informática total (GB-s) = 560 000 segundos * 4096 MB/1024 MB = 2 240 000 GB-s.
    Cargos totales por informática = 2 240 000 GB-s * 0,0000097222 USD = 21,78 USD

    Cargos de solicitudes mensuales:
    El precio mensual por solicitudes es de 0,20 USD por cada millón de solicitudes
    Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USD

    Cargos mensuales totales:
    Cargos totales = cargos por simultaneidad aprovisionada + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por solicitudes = 10,08 USD + 21,78 USD + 0,40 USD = 32,26 USD

Precios de la secuencia de respuestas HTTP de Lambda

Las funciones de AWS Lambda pueden devolver una secuencia de respuesta HTTP cuando se invocan mediante la API InvokeWithResponseStream o mediante la URL de función mediante el modo de invocación ResponseStream. La secuencia de respuestas HTTP puede mejorar el rendimiento del tiempo hasta el primer byte y admite cargas superiores a 6 MB. Al utilizar la secuencia de respuestas HTTP, su función le cobrará por cada GB que escriba en la secuencia de respuesta. Puede reproducir los primeros 6 MB por solicitud sin costo alguno.

Todos los ejemplos que se muestran a continuación se basan en el precio de la región Este de EE. UU. (Norte de Virginia).

Transferencia de datos y otros cargos

Transferencia de datos
Los datos que se transfieren tanto desde como hacia las funciones de AWS Lambda desde fuera de la región en la que se ejecutan se cobrarán con los precios para transferencias de datos de Amazon EC2 tal y como se describen en la sección “Transferencia de datos”.

La transferencia de datos con AWS Lambda Functions es gratuita en la misma región de AWS entre los siguientes servicios: Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) y Amazon SimpleDB.

El uso de Amazon Virtual Private Cloud (VPC) o interconexión de VPC con funciones de AWS Lambda incurrirá en cargos adicionales como se explica en la página de precios de servicios en diferido de Amazon Elastic Compute Cloud (EC2). Una interconexión de VPC es una conexión de redes entre dos VPC que permite enrutar el tráfico entre ellas mediante direcciones IPv4 privadas o direcciones IPv6

Cargos adicionales
Puede incurrir en cargos adicionales si su función Lambda utiliza otros servicios de AWS o transfiere datos. Por ejemplo, si su función Lambda lee y escribe datos en Amazon S3, se le facturará por las solicitudes de lectura o escritura y los datos almacenados en Amazon S3.

Para obtener más detalles sobre los precios de los servicios de AWS, consulte la sección de precios en las páginas de los productos de AWS correspondientes.

Precios de Lambda@Edge

Las funciones de Lambda@Edge se calculan con una granularidad de 1 ms

  • Si la función de Lambda@Edge se ejecuta 10 millones de veces en un mes durante 10 ms cada vez, el costo se calcularía de la siguiente manera:

    Cargos por cómputos mensuales

    El precio mensual por cómputos es de 0,00000625125 USD por 128 MB/segundo

    Cómputos totales (segundos) = 10 millones * (0,01 s) = 100 000 segundos

    Cargos por cómputos mensuales = 100 000 * 0,00000625125 USD = 0,63 USD


    Cargos de solicitudes mensuales

    El precio de solicitud mensual es de 0,60 USD por millón de solicitudes.

    Cargos de solicitudes mensuales = 10 millones * 0,6 USD/millón = 6,00 USD
     

    Cargos mensuales totales

    Cargos totales = cargos por cómputos + cargos de solicitudes = 0,63 USD + 6,00 USD = 6,63 USD al mes

Recursos de precios adicionales

Calculadora de precios de AWS

Calcule fácilmente los costos mensuales en AWS

Obtenga asistencia de precios

Contacte con los especialistas de AWS para obtener un presupuesto personalizado