AWS Lambda

Información general

AWS Lambda es un servicio de computación sin servidor que permite ejecutar código sin aprovisionar ni administrar servidores. Cree una lógica de escalado de clústeres que tenga en cuenta la carga de trabajo, mantenga las integraciones de eventos y administre los tiempos de ejecución con facilidad. Con Lambda, puede ejecutar código para casi cualquier aplicación o servicio backend sin administración de servidores y con un modelo de pago basado únicamente en el uso real. El cobro se determina por la cantidad de solicitudes para las funciones y el tiempo de ejecución del código.

Lambda cuenta una solicitud cada vez que comienza a ejecutarse en respuesta a un desencadenador de notificación de eventos (desde Amazon Simple Notification Service (SNS) o Amazon EventBridge, por ejemplo) o una llamada de invocación (desde Amazon API Gateway, por ejemplo) o a través de AWS SDK, lo que incluye las invocaciones de prueba desde la consola de AWS.

La duración se calcula desde el momento en que el código inicia la ejecución hasta que devuelve una respuesta o termina por cualquier motivo, redondeada al milisegundo más cercano.* El precio depende de la cantidad de memoria asignada a la función. En el modelo de recursos de AWS Lambda, debe elegir el volumen de memoria que desea para la función y, posteriormente, se asignará la capacidad proporcional de CPU y de otros recursos. Un aumento en el tamaño de la memoria provoca un incremento equivalente en la CPU disponible para la función. Para obtener más información, consulte la documentación sobre la configuración de funciones.

Puede ejecutar las funciones de Lambda en procesadores basados en arquitecturas x86 o Arm. Las funciones de AWS Lambda que se ejecutan en Graviton2, con una arquitectura de procesador basada en Arm diseñada por AWS, ofrecen un rendimiento de precios hasta un 34 % mejor en comparación con las funciones que se ejecutan en procesadores x86. Esto se aplica a una variedad de cargas de trabajo sin servidor, como aplicaciones web y móviles, backends, procesamiento de datos y procesamiento de contenido multimedia.

* Los cargos por duración se aplican al código que se ejecuta dentro del controlador de la función, así como al código de inicialización declarado fuera del controlador. En el caso de las funciones de Lambda con Extensiones de AWS Lambda, la duración también incluye el tiempo que tarda en completarse la ejecución del código en la última extensión activa durante la fase de apagado. En el caso de las funciones de Lambda configuradas con SnapStart, la duración también incluye el tiempo que tarda en cargarse el tiempo de ejecución, cualquier código que se ejecute en un enlace de versión ejecutable, y el código de inicialización ejecutado durante la creación de las copias de instantáneas usadas para la resiliencia. Para obtener más información, consulte la documentación del modelo de programación de Lambda.

El nivel gratuito de AWS Lambda incluye un millón de solicitudes gratuitas por mes y 400 000 GB-segundos de tiempo de computación por mes, utilizable para funciones basadas en procesadores x86 y Graviton2, en total. Además, el nivel gratuito incluye 100 GiB por mes de transmisión de respuestas HTTP, más allá de los primeros 6 MB por solicitud, que no tienen costo. Lambda también ofrece opciones de precios por niveles para la duración bajo demanda que supera ciertos umbrales de uso mensual. AWS Lambda forma parte de Savings Plans para computación, un modelo de precios flexible que ofrece precios económicos por el uso de Amazon Elastic Compute Cloud (Amazon EC2), AWS Fargate y Lambda a cambio de comprometerse a una cantidad constante de uso (medida en USD por hora) durante un plazo de uno o tres años. Con Compute Savings Plans puede ahorrar hasta un 17 % en AWS Lambda. El ahorro se aplica a la duración y a la simultaneidad aprovisionada. Más información

people at desk

Calculadora de precios de AWS

Calcule el costo de su AWS Lambda y el de la arquitectura en una sola cotización.

Cree una cotización personalizada ahora

hands with calculator

Precios de AWS Lambda

Funciones de Lambda (predeterminada)

Evento asíncrono (incluidos eventos de S3, SNS, EventBridge, Step Functions y Registros de CloudWatch): Se le cobra 1 solicitud por cada evento asíncrono por los primeros 256 KB. Para eventos individuales cuyo tamaño supera los 256 KB, se cobra 1 solicitud adicional por cada bloque de 64 KB, hasta 1 MB.

El costo de duración depende de la cantidad de memoria que asigne a la función. Puede asignar cualquier cantidad de memoria a la función entre 128 MB y 10 240 MB, en incrementos de 1 MB. La siguiente tabla muestra algunos ejemplos del precio por cada 1 ms asociado a distintos tamaños de memoria, para un uso dentro del primer nivel de precios (por ejemplo, hasta 6000 millones de GB-segundos al mes en la región del Este de EE. UU. (Ohio)

  • Precio de x86
  • Precio de Arm

Los niveles de precios de duración bajo demanda de Lambda se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura (x86 o Arm, respectivamente), en la misma región y dentro de la cuenta. Si utiliza facturación consolidada en AWS Organizations, los niveles de precios se aplican a la duración mensual agregada de las funciones que se ejecutan en la misma arquitectura, en la misma región y en las cuentas de la organización.

Instancias administradas de Lambda

Las instancias administradas de Lambda permiten ejecutar funciones de Lambda en instancias de EC2 completamente administradas dentro de la VPC. Este enfoque combina la simplicidad del modelo sin servidor de Lambda con la eficiencia de costos y la flexibilidad del hardware que EC2 ofrece. Esta característica resulta ideal para cargas estables y de alto volumen en las que desea optimizar costos sin perder la simplicidad operativa que distingue a Lambda.

Con las instancias administradas de Lambda, puede elegir entre una amplia variedad de tipos de instancias de EC2 de última generación para ajustarse a los requisitos de la carga de trabajo, beneficiarse de las opciones de precios de EC2 (Savings Plans para instancias de EC2, Savings Plans para computación e instancias reservadas), procesar múltiples solicitudes de forma simultánea dentro del mismo entorno de ejecución para maximizar la utilización de los recursos. Lambda se encarga automáticamente del aprovisionamiento, el escalado, los parches y la administración del ciclo de vida de las instancias, mientras usted conserva el modelo de programación ya conocido de Lambda y la integración fluida con orígenes de eventos como SQS, Kinesis y Kafka.

Precios:
Los precios de las instancias administradas de Lambda tienen tres componentes:

1. Cargos por solicitud: 0,20 USD por millón de solicitudes
2. Tarifa de administración de computación: se aplica un recargo del 15 % sobre el precio bajo demanda de las instancias de EC2 que Lambda aprovisiona y administra. (El recargo específico por tipo de instancia se indica más abajo).
3. Cargo por instancias de EC2: se aplican los precios estándar de instancias de EC2 para las instancias aprovisionadas en el proveedor de capacidad. Puede reducir costos gracias a los Savings Plans para computación, instancias reservadas y otras opciones de precios disponibles para EC2.

Tenga en cuenta que las funciones que utilizan instancias administradas de Lambda no pagan un cargo separado por la duración de ejecución de cada solicitud, a diferencia de las funciones de computación predeterminadas de Lambda.

Asignación de orígenes de eventos: en el caso de las cargas de trabajo que utilizan unidades de sondeo de eventos (EPU) aprovisionadas con orígenes de eventos como Kafka o SQS, se aplica el precio estándar de 0,00925 USD por hora de EPU.

  • Supongamos que ejecuta un servicio de API con alto tráfico que procesa 100 millones de solicitudes al mes, con una duración promedio de 200 ms por solicitud. Configura el proveedor de capacidad de instancias administradas de Lambda para utilizar instancias m7g.xlarge (4 vCPU, 16 GB de memoria, Graviton3) y adopta un Savings Plan para computación a tres años para maximizar el ahorro.

    Cargos mensuales

    Cargos por solicitudes
    Solicitudes mensuales: 100 millones de solicitudes
    Precio de solicitud: 0,20 USD por millón de solicitudes
    Cargos mensuales por solicitudes: 100 millones/1 millón × 0,20 USD = 20 USD

    Cargos por computación
    Tipo de instancia: m7g.xlarge
    Precio de EC2 bajo demanda: 0,1632 USD por hora (Norte de Virginia, Este de EE. UU.)
    Si se aplica el descuento del Savings Plan para computación de 3 años (72 %): 0,0457 USD por hora
    Horas estimadas de instancia necesarias: ~2 000 horas al mes (según el patrón de la carga de trabajo y la simultaneidad múltiple).
    Cargos mensuales por instancia de EC2: 2000 × 0,0457 USD = 91,40 USD

    Cargos de tarifa de administración
    Tarifa de administración: 15 % del precio bajo demanda de EC2
    Tarifa de administración por hora: 0,1632 USD × 0,15 = 0,02448 USD por hora
    Cuota de administración mensual: 2000 × 0,02448 USD = 48,96 USD

    Cargos mensuales totales
    Cargos totales = cargos de solicitud + cargos de instancia de EC2 + cargos de administración
    Cargos totales = 20 USD + 91,40 USD + 48,96 USD = 160,36 USD

Precios de aislamiento de inquilinos

Habilite el modo de aislamiento de inquilinos para aislar el procesamiento de solicitudes de cada usuario final o inquilino que invoque la función de Lambda. Los entornos de ejecución subyacentes de una función de Lambda aislada por inquilino siempre están asociados a un inquilino específico y nunca se utilizan para procesar solicitudes de otros inquilinos que invoquen la misma función. Esta capacidad simplifica el desarrollo y la administración de aplicaciones de varios inquilinos que procesan código o datos específicos de cada inquilino, con requisitos estrictos de aislamiento entre inquilinos. Se cobra cuando Lambda crea un nuevo entorno de ejecución aislado por inquilino para atender una solicitud, según la cantidad de memoria asignada a la función y la arquitectura de CPU que utilice. Para obtener más información sobre la capacidad de aislamiento de inquilinos de Lambda, consulte la documentación.

  • Aplicación SaaS de varios inquilinos

    Supongamos que crea una plataforma de automatización que ejecuta código proporcionado por los usuarios en respuesta a eventos. Por ejemplo, un equipo de TI desea ejecutar un flujo de trabajo automatizado cuando un nuevo empleado se incorpora a la organización o se traslada entre departamentos. Como otro ejemplo, un equipo de DevOps desea activar un flujo de trabajo de CI/CD cuando un desarrollador confirma cambios de código en su repositorio de código fuente. La plataforma de automatización es de varios inquilinos, lo que significa que atiende a varios usuarios finales. Dado que anticipa una gran variación en la demanda según la hora del día y según cada usuario o inquilino, crea la plataforma con servicios sin servidor, como AWS Lambda.

    La plataforma de automatización admite la capacidad de ejecutar código proporcionado por los usuarios en respuesta a eventos. Como no controla el código que proporcionan los usuarios, habilita el modo de aislamiento de inquilinos para garantizar que las invocaciones a las funciones de Lambda correspondientes a cada usuario final se procesen en entornos de ejecución separados y aislados entre sí.

    Suponga que ha configurado la función de Lambda con 1024 MB de memoria y arquitectura de CPU x86. Durante un mes típico, la función procesa 10 millones de invocaciones con una duración promedio de 2 segundos por invocación. La plataforma SaaS es utilizada por 1000 usuarios finales o inquilinos. Para simplificar, supongamos que, en promedio, cada inquilino genera 10 000 invocaciones por mes y que Lambda crea 200 entornos de ejecución por inquilino (es decir, una tasa de arranque en frío del 2 % por inquilino).

    Los cargos se calcularían de la siguiente manera:

    Cargos por solicitudes
    Al mes, la función se ejecuta 10 millones de veces.

    Cargos de solicitudes mensuales = 10 millones * 0,2 USD/millón = 2 USD.

    Cargos por computación
    Al mes, la función se ejecuta 10 millones de veces con una duración media de 2 segundos. La memoria configurada de la función es de 1024 MB.

    Duración mensual de computación (segundos): 10 millones * 2 segundos = 20 millones de segundos
    Computación mensual (GB-s): 20 millones de segundos * 1024 MB/1024 MB = 20 millones de GB-s
    Cargos mensuales por computación : 20 millones * 0,0000166667 USD = 333,34 USD

    Cargos por aislamiento de inquilinos
    En promedio, cada mes la función presta servicio a 1000 inquilinos únicos. Cada inquilino invoca la función 10 000 veces, con un promedio de 200 entornos de ejecución creados por inquilino (es decir, una tasa de arranque en frío promedio del 2 % para cada inquilino).

    Entornos de ejecución mensuales creados para 1000 inquilinos: 200 × 1000 = 200 000
    Cargos mensuales por aislamiento de inquilinos: 200 000 × 0,000167 USD × 1024 MB/1024 MB = 33,4 USD

    Cargos mensuales totales
    Cargos totales = cargos por solicitudes + cargos por computación + cargos por aislamiento de inquilinos
    Cargos totales = 2 USD + 333,34 USD + 33,4 USD = 368,74 USD

Precios del almacenamiento efímero de Lambda

Los costos del almacenamiento efímero dependen de la cantidad de almacenamiento efímero que se asigne a la función y de la duración de ejecución de la función, medida en milisegundos. Puede asignar a la función cualquier cantidad adicional de almacenamiento entre 512 MB y 10 240 MB en incrementos de 1 MB. Puede configurar el almacenamiento efímero para las funciones que se ejecutan en arquitecturas x86 y Arm. Para cada función de Lambda, están disponibles 512 MB de almacenamiento efímero sin costo adicional. Solo paga por el almacenamiento efímero adicional que configure.

Todos los ejemplos que se muestran a continuación se basan en el precio de la región Este de EE. UU. (Norte de Virginia).

  • Supongamos que es un desarrollador de aplicaciones móviles que crea una aplicación para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.

    Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria en un procesador basado en x86. Los cargos se calcularían de la siguiente manera:

    Cargos mensuales por informática

    El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 3 millones * 120 ms = 360 000 segundos
    Capacidad informática total (GB/s) = 360 000 * 1536 MB/1024 MB = 540 000 GB/s
    Informática total – informática en el nivel gratuito = GB-s de informática facturable al mes
    540 000 GB-s – 400 000 GB-s en el nivel gratuito = 140 000 GB-s
    Cargos mensuales por informática =
    140 000 * 0,0000166667 USD = 2,33 USD

    Cargos de solicitudes mensuales

    El precio mensual por solicitudes es de 0,20 USD por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
    3 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 millones de solicitudes mensuales facturables
    Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USD

    Cargos mensuales totales

    Cargos totales = cargos por informática + cargos por solicitudes = 2,33 USD + 0,40 USD = 2,73 USD al mes

  • Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en un flujo de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.

    Supongamos que hay 10 000 vehículos en el sitio, cada uno de los cuales emite telemetría una vez por hora de forma escalonada con suficiente fluctuación. Pretende llevar a cabo esta inferencia en cada carga para asegurarse de que los vehículos están programados puntualmente para el mantenimiento y garantizar el estado óptimo de su flota.

    Supongamos que el modelo de ML está empaquetado junto con la función y tiene un tamaño de 512 MB. Para la inferencia, ha configurado su función con 1 GB de memoria y la ejecución de la función tarda una media de 2 segundos en completarse en un procesador basado en x86.

    Cargos de solicitudes mensuales:
    Al mes, los vehículos emitirán 10 000 * 24 * 31 = 7 440 000 mensajes que serán procesados por la función Lambda.

    Cargos de solicitudes mensuales → 7,44 millones * 0,20 USD por millón = 1,488 USD ~= 1,49 USD

    Cargos mensuales por informática:
    Al mes, las funciones se ejecutarán una vez por mensaje durante 2 segundos.

    Duración mensual de informática (segundos) → 7,44 millones * 2 segundos = 14,88 millones de segundos
    Informática mensual (GB-s) → 14,88 millones de segundos * 1024 MB/1024 MB = 14,88 GB-s
    Cargos mensuales por informática → 14,88 millones de GB-s * 0,0000166667 USD = 248,00 USD

    Cargos mensuales totales:
    Cargos mensuales totales = cargos por solicitudes + cargos por informática = 1,49 USD + 248,00 USD = 249,49 USD

  • Supongamos que es una empresa de servicios financieros que desea conocer mejor sus principales problemas de atención al cliente. Su objetivo es mejorar la experiencia del cliente y reducir la pérdida de clientela. Los clientes pueden conversar en directo con el personal de atención al cliente a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).

    En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o derivar al cliente al agente de atención adecuado. El número de consultas de asistencia que procesa su modelo de inferencia varía mucho a lo largo de la semana.

    Supongamos que sus funciones que ejecutan el modelo de inferencia reciben 6 millones de solicitudes al mes. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86.

    También configura la función para que utilice 2048 MB de almacenamiento efímero.

    Los cargos se calcularían de la siguiente manera:

    Cargos mensuales por informática:
    El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
    Informática total (GB-s) = 1 680 000 * 4096 MB/1024 MB = 6 720 000 GB-s
    Informática total – informática en el nivel gratuito de AWS = GB-s de informática facturable al mes
    6 720 000 GB-s – 400 000 GB-s en el nivel gratuito = 6 320 000 GB-s
    Cargos mensuales por informática = 6 320 000 * 0,0000166667 USD = 105,33 USD

    Cargos mensuales por solicitudes:
    El precio mensual por solicitudes es de 0,20 USD por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
    6 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 5 millones de solicitudes mensuales facturables
    Cargos mensuales por solicitudes = 5 millones * 0,2 USD por millón = 1 USD

    Cargos mensuales por almacenamiento efímero:
    El precio mensual por almacenamiento efímero es de 0,0000000309 USD por cada GB/segundo y Lambda ofrece 512 MB de almacenamiento sin costo adicional.
    Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
    Almacenamiento efímero total facturable = 2048 MB – 512 MB = 1536 MB
    Almacenamiento efímero total (GB-s) = 1 680 000 * 1536 MB/1024 MB = 2 520 000 GB-s
    Cargos mensuales por almacenamiento efímero = 2 520 000 * 0,0000000309 USD = 0,08 USD

    Cargos mensuales totales:
    Cargos totales = cargos por informática + cargos por solicitudes = 105,33 USD + 1 USD + 0,08 USD = 106,41 USD al mes

Precios de la simultaneidad aprovisionada

Para tener mayor control sobre el rendimiento de sus aplicaciones sin servidor, habilite la simultaneidad aprovisionada para sus funciones Lambda. Cuando se habilita, la simultaneidad aprovisionada mantiene las funciones activadas y en el mayor estado de preparación para responder en milisegundos de dos dígitos. Paga por la cantidad de simultaneidad que configura y por el periodo por el que lo hace. Cuando la simultaneidad aprovisionada está habilitada y se ejecuta para su función, también paga por las solicitudes y por la duración en función de los precios que se muestran a continuación. Si la función supera la simultaneidad configurada, se cobrará por la ejecución excedente según la tarifa especificada en la sección de precios de AWS Lambda. Puede activar la simultaneidad aprovisionada para las funciones que se ejecutan en las arquitecturas x86 y Arm. Para obtener más información sobre la simultaneidad aprovisionada, consulte la documentación.

La simultaneidad aprovisionada se calcula desde el momento en que la habilita para su función hasta que la desactiva y se redondea a los 5 minutos más cercanos. El precio depende del volumen de memoria que asigne a su función y la cantidad de simultaneidad que configure. La duración se calcula a partir del momento en que el código comienza a ejecutarse hasta que regresa o finaliza de algún modo, y se redondea al 1 ms más cercano**. El precio depende del volumen de memoria asignado a la función.

** Los cargos de duración se aplican al código que se ejecuta en el gestor de una función, así como al código de inicialización que se declara fuera del gestor. En el caso de las funciones de Lambda con extensiones de AWS Lambda, la duración también incluye el tiempo que tarda el código de la última extensión en ejecución en terminar de ejecutarse durante la fase de cierre. Para las funciones configuradas con simultaneidad aprovisionada, AWS Lambda recicla periódicamente los entornos de ejecución y repite el código de inicialización. Para obtener más detalles, revise la documentación del modelo de programación de Lambda.

No se aplicará el nivel gratuito de Lambda a las funciones que tengan habilitada la simultaneidad aprovisionada. Si habilita la simultaneidad aprovisionada en una función y luego la ejecuta, se le cobrará por las solicitudes y por la duración en función de los precios que se muestran a continuación.

Todos los ejemplos que se muestran a continuación se basan en el precio de la región EE. UU. Este (Norte de Virginia).

  • Supongamos que es un desarrollador de aplicaciones móviles y crea una aplicación móvil para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda de su aplicación, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.

    Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La
    duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria, en un procesador basado en x86.

    Va a hacer el lanzamiento de la nueva versión de su aplicación móvil, que ha comercializado intensamente. Espera un pico en la demanda durante el día del lanzamiento, desde el mediodía hasta las 8 de la tarde. Quiere que su aplicación móvil tenga capacidad de respuesta incluso cuando la demanda aumenta y disminuye rápidamente, por lo que habilita la simultaneidad aprovisionada en sus funciones Lambda. Establece la simultaneidad aprovisionada en 100.

    Durante esas ocho horas, sus funciones recibieron 500 000 solicitudes. La duración media
    de ejecución de la función mientras la simultaneidad aprovisionada está habilitada es de 100 ms. Durante el resto del mes, su aplicación recibe las 2,5 millones de solicitudes adicionales y las funciones se ejecutan en respuesta a ellas sin que esté habilitada la simultaneidad aprovisionada.

    Los cargos se calcularían de la siguiente manera:

    Cargos por simultaneidad aprovisionada:
    El precio de la simultaneidad aprovisionada es de 0,0000041667 USD por cada GB-s
    Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 8 horas = 3600 segundos = 28 800 segundos
    Simultaneidad configurada total (GB): 100 * 1536 MB/1024 MB = 150 GB
    Cantidad total de simultaneidad aprovisionada (GB-s) = 150 GB * 28 800 segundos = 4 320 000 GB-s
    Cargos por simultaneidad aprovisionada: 4,32 millones de GB-s * 0,0000041667 USD = 18 USD

    Cargos por solicitudes:
    El precio mensual por solicitudes es de 0,20 USD por cada millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – solicitudes en el nivel gratuito = solicitudes facturables al mes
    3 000 000 de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 000 000 de solicitudes facturables al mes
    Cargos de solicitudes mensuales = 2 * 0,20 USD = 0,40 USD

    Cargos por informática cuando la simultaneidad aprovisionada está habilitada:
    El precio de la informática es de 0,0000097222 USD por GB-s
    Duración total de informática (segundos) = 500 000 * 100 ms = 50 000 segundos
    Informática total (GB-s) = 50 000 segundos * 1536 MB/1024 MB = 75 000 GB-s.
    Cargos totales por informática = 75 000 GB-s * 0,0000097222 USD = 0,73 USD

    Cargos por informática cuando la simultaneidad aprovisionada está desactivada:
    El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 2,5 millones * 120 ms = 300 000 segundos
    Informática total (GB-s) = 300 000 * 1536 MB/1024 MB = 450 000 GB-s
    Informática total – informática en el nivel gratuito = GB-s de informática facturable al mes
    450 000 GB-s – 400 000 GB-s en el nivel gratuito = 50 000 GB-s
    Cargos mensuales por informática = 50 000 * 0,0000166667 USD = 0,83 USD

    Cargos mensuales totales:
    Cargos totales = cargos de simultaneidad aprovisionada + cargos por solicitud + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por informática cuando la simultaneidad aprovisionada está desactivada
    Cargos totales = 18 USD + 0,40 USD + 0,73 USD + 0,83 USD = 19,96 USD

  • Supongamos que es un minorista que lleva a cabo una gran venta durante Cyber Monday, una fiesta del comercio electrónico que tiene lugar el lunes después de Acción de Gracias en Estados Unidos. Sus clientes pueden conversar en directo con el servicio de asistencia a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).

    En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o dirigir al cliente con el agente de atención adecuado. Durante esta venta recibirá muchas más consultas de asistencia al cliente de lo habitual, por lo que decide habilitar simultaneidad aprovisionada en sus funciones Lambda para que la aplicación responda rápidamente incluso cuando experimente picos de tráfico.

    Supongamos que sus funciones reciben dos millones de solicitudes durante las 24 horas del evento de venta, mientras la simultaneidad aprovisionada está habilitada. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86 y se estableció la simultaneidad aprovisionada en siete.

    Los cargos se calcularían de la siguiente manera:

    Cargos por simultaneidad aprovisionada:
    El precio de la simultaneidad aprovisionada es de 0,0000041667 USD por cada GB-s.
    Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 24 horas = 3600 segundos = 86 400 segundos
    Simultaneidad configurada total (GB): 7 * 4096 MB/1024 MB = 28 GB
    Cantidad total de simultaneidad aprovisionada (GB-s) = 28 GB * 86 400 segundos = 2 419 200 GB-s
    Cargos por simultaneidad aprovisionada = 2 419 200 GB-s * 0,0000041667 USD = 10,08 USD

    Cargos por informática cuando la simultaneidad aprovisionada está habilitada:
    El precio de la informática es de 0,0000097222 USD por GB-s.
    Duración total de informática (segundos) = 2 000 000 * 280 ms = 560 000 segundos
    Informática total (GB-s) = 560 000 segundos * 4096 MB/1024 MB = 2 240 000 GB-s.
    Cargos totales por informática = 2 240 000 GB-s * 0,0000097222 USD = 21,78 USD

    Cargos de solicitudes mensuales:
    El precio mensual por solicitudes es de 0,20 USD por cada millón de solicitudes
    Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USD

    Cargos mensuales totales:
    Cargos totales = cargos por simultaneidad aprovisionada + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por solicitudes = 10,08 USD + 21,78 USD + 0,40 USD = 32,26 USD

Precios de SnapStart

SnapStart puede mejorar el rendimiento de inicio de varios segundos a tan solo menos de un segundo para las aplicaciones sensibles a la latencia. SnapStart crea una instantánea del estado inicializado de la memoria (y el disco) de la función y almacena en caché esta instantánea para un acceso de baja latencia. Cuando se invoca la función posteriormente, Lambda reanuda los entornos de ejecución a partir de esta instantánea preinicializada, en lugar de inicializarlos desde cero, lo que mejora la latencia de inicio.

Se crea una instantánea cada vez que publica una nueva versión de la función con SnapStart activado. Se le cobra por almacenar en caché una instantánea durante el periodo en el que la versión de su función esté activa, durante un mínimo de 3 horas y por milisegundo a partir de entonces. El precio depende del volumen de memoria asignado a la función. También se le cobrará cada vez que Lambda reanude un entorno de ejecución mediante la restauración de la instantánea, y el precio dependerá de la cantidad de memoria que asigne a la función.

Los precios de SnapStart no se aplican a las versiones ejecutables administradas de Java compatibles.

  • Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en una secuencia de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.

    Supongamos que hay 10 000 vehículos en el sitio, cada uno de los cuales emite telemetría una vez por hora de forma escalonada con suficiente fluctuación. Pretende llevar a cabo esta inferencia en cada carga para asegurarse de que los vehículos están programados puntualmente para el mantenimiento y garantizar el estado óptimo de su flota.

    Supongamos que el modelo de ML está empaquetado junto con la función y tiene un tamaño de 512 MB. Para la inferencia, configuró su función con 1 GB de memoria y la ejecución facturada tarda una media de dos segundos en un procesador basado en x86. Mantiene una única versión de la función. Para simplificar, supongamos que el 1 % de todas las solicitudes dan lugar a la creación de nuevos entornos de ejecución.

    Observa que el procesamiento de principio a fin tarda varios segundos para este 1 % de las solicitudes. Esto se debe a que la inicialización de la función tarda varios segundos, ya que importa módulos de software grandes y el modelo ML durante la inicialización. Desea reducir el tiempo de procesamiento de principio a fin de estas solicitudes, por lo que debe habilitar SnapStart en la función y publicar una nueva versión.

    Los cargos se calcularían de la siguiente manera:

    Cargos por solicitudes
    Al mes, los vehículos emitirán 10 000 * 24 * 31 = 7 440 000 mensajes que serán procesados por la función de Lambda.

    Cargos de solicitudes mensuales: 7,44 millones * 0,20 USD por millón = 1,49 USD

    Cargos de computación mensuales
    Al mes, su función se ejecutará una vez por mensaje durante dos segundos.

    Duración mensual de computación (segundos): 7,44 millones * 2 segundos = 14,88 millones de segundos
    Computación mensual (GB/s): 14,88 millones de segundos* 1024 MB/1024 MB = 14,88 millones de GB/s
    Cargos mensuales de computación: 14,88 millones de GB/s * 0,0000166667 USD = 248,00 USD

    Cargos de SnapStart:

    Periodo total durante el cual la versión de la función está activa (segundos): 24 horas * 31 días * 3600 segundos = 2 678 400 segundos
    Memoria asignada para funciones: 1024 MB/1024 MB -> 1 GB
    Caché total de SnapStart utilizado: 1 GB * 2 678 400 segundos -> 2 678 400 GB/s
    Cargos por la caché de SnapStart: 2,68 millones de GB/s * 0,0000015046 USD = 4,03 USD

    Número de solicitudes que utilizan SnapStart Restore: 1 % de 7,44 millones = 74 400
    Total de SnapStart Restore utilizado: 74 400 x 1 GB = 74 400 GB
    Cargos de restauración de SnapStart: 74 400 GB * 0,0001397998 = 10,4 USD

    Cargos totales de SnapStart: cargos por la caché de SnapStart + cargos de restauración de SnapStart
    Cargos totales de SnapStart: 4,03 USD + 10,4 USD = 14,43 USD

    Cargos mensuales totales

    Cargos totales = cargos por solicitudes + cargos por computación + cargos de SnapStart
    Cargos totales = 1,49 USD + 248,00 USD + 14,43 USD = 263,92 USD

Precios de la secuencia de respuestas HTTP de Lambda

Las funciones de AWS Lambda pueden devolver una secuencia de respuesta HTTP cuando se invocan mediante la API InvokeWithResponseStream o mediante la URL de función mediante el modo de invocación ResponseStream. La secuencia de respuestas HTTP puede mejorar el rendimiento del tiempo hasta el primer byte y admite cargas superiores a 6 MB. Al utilizar la secuencia de respuestas HTTP, su función le cobrará por cada GB que escriba en la secuencia de respuesta. Puede reproducir los primeros 6 MB por solicitud sin costo alguno.

Todos los ejemplos que se muestran a continuación se basan en el precio de la región Este de EE. UU. (Norte de Virginia).

Precios del modo aprovisionado para la asignación de orígenes de eventos (ESM)

El modo aprovisionado para ESM permite optimizar el rendimiento de ESM al definir un número mínimo y máximo de recursos llamados sondeadores de eventos, y al activar el escalado automático entre esos límites configurados. Un sondeador de eventos es el recurso configurable que sustenta un ESM en modo aprovisionado. Los precios se basan en la cantidad mínima aprovisionada de sondeadores de eventos y en los sondeadores de eventos que se consumen durante el escalado automático. Los cargos se calculan con una unidad de facturación denominada unidad de sondeo de eventos (EPU). Se paga por la cantidad y la duración de las EPU utilizadas, medidas en horas de unidad de sondeo de eventos.

SQS ESM: una EPU admite un sondeador de eventos, y cada sondeador proporciona hasta 1 MB/s de rendimiento. Cada SQS ESM requiere un mínimo de 2 sondeadores de eventos.

MSK o Kafka autoadministrado (SMK) ESM: cada EPU admite hasta 20 MB/s de capacidad de rendimiento para el sondeo de eventos, con un valor predeterminado de 10 sondeadores de eventos. Cada sondeador de eventos puede escalar verticalmente hasta 5 MB/s de rendimiento. La cantidad de sondeadores de eventos asignados a una EPU depende de la capacidad de computación consumida por cada sondeador. Es posible agrupar varios ESM dentro de la misma Amazon VPC para compartir la capacidad de EPU y reducir costos. Para obtener información sobre el modo aprovisionado para Kafka ESM, consulte la documentación

Transferencia de datos: se le cobrarán las tarifas estándar de transferencia de datos de AWS.

Duración: el precio se calcula por segundo con un mínimo de 1 minuto.

  • Ejemplo: análisis de datos de streaming en tiempo real con Kafka

    Supongamos que es un proveedor global de soluciones de centros de atención al cliente y tiene canalizaciones que envían metadatos relacionados con la experiencia de las llamadas a temas de Amazon MSK (Kafka) para su análisis en tiempo real. Dado que el tráfico puede ser irregular e impredecible, es recomendable utilizar el modo aprovisionado para ESM a fin de refinar el rendimiento de su ESM. Supongamos que la función de Lambda que procesa estos mensajes está configurada con 1024 MB de memoria para el procesador x86 y recibe 1 millón de invocaciones por día con una duración media de 2 segundos. Supongamos que ha activado el modo aprovisionado para su ESM con el sondeador de 1 evento predeterminado y que su ESM se escala verticalmente hasta consumir 800 horas de EPU al mes en el este de EE. UU. (Norte de Virginia).

    Cargos de computación mensuales
    El precio de mensual por computación es de 0,0000166667 USD por GB-s, y el nivel gratuito ofrece 400 000 GB-s
    Gastos de computación totales (segundos) = 1 000 000 * 30 * 2 segundos = 60 000 000 segundos
    Gastos de computación totales (GB-s) = 60 000 000 * 1024 MB/1024 = 60 000 000 GB-s
    Gastos de computación totales – computación en el nivel gratuito = GB-s de computación facturable al mes
    60 000 000 GB-s – 400 000 GB-s en el nivel gratuito = 59 600 000 GB-s
    Cargos mensuales por computación = 59 600 000 * 0,0000166667 USD = 993,3 USD

    Cargos de solicitudes mensuales
    El precio de solicitud mensual es de 0,20 USD por millón de solicitudes.
    Cargos de solicitudes mensuales = 60 millones de solicitudes * 0,20 USD = 12,00 USD

    Modo aprovisionado mensual para cargos de ESM
    Cargos de EPU = 800 horas de EPU * 0,185 USD = 148 USD
    Modo aprovisionado mensual para cargos de ESM = 148 USD

    Cargos totales
    Cargos totales = cargos por computación + cargos por solicitudes + cargos de modo aprovisionado para ESM
    Cargos totales = 993,3 USD + 12 USD + 148 USD = 1153,3 USD

     

  • Ejemplo: procesamiento de eventos en tiempo real con Amazon SQS

    Suponga que su empresa de servicios financieros procesa orígenes de datos del mercado y ejecuta transacciones financieras mediante microservicios basados en eventos para una aplicación financiera de atención al cliente en tiempo real. Dado que el tráfico puede ser irregular e impredecible, desea habilitar el modo aprovisionado para el ESM de SQS con el fin de refinar el rendimiento de ESM. Suponga que la función de Lambda, encargada de procesar estos eventos, está configurada con 1024 MB de memoria para procesador x86 y recibe 1 millón de invocaciones diarias con una duración promedio de 1 segundo. Tiene un máximo de 100 eventos por segundo (TPS) que desea procesar con una latencia máxima de 0,2 segundos. Para alcanzar este rendimiento de baja latencia, habilita el modo aprovisionado para ESM de SQS con un mínimo de 10 sondeadores de eventos, y ESM escala verticalmente hasta consumir 8000 horas de EPU por mes en la región este de EE. UU. (norte de Virginia), para manejar este tráfico irregular con baja latencia.

    Cargos de computación mensuales
    El precio mensual de computación es de 0,0000166667 USD por cada GB-s
    Computación total (segundos) = 1 000 000 * 30 * 1 segundos = 30 000 000 segundos
    Computación total (GB-s) = 30 000 000 * 1024 MB/1024 = 30 000 000 GB-s
    Computación total = computación facturable mensualmente GB-s * 0,0000166667 USD
    Cargos mensuales por computación = 30 000 000 * 0,0000166667 USD = 500 USD

    Cargos de solicitudes mensuales
    El precio mensual por solicitudes es de 0,20 USD por millón de solicitudes
    Cargos de solicitudes mensuales = 30 millones de solicitudes * 0,20 USD = 6 USD

    Cargos mensuales del modo aprovisionado para ESM de SQS
    El precio por EPU es de 0,00925 USD por hora de EPU
    Cargos por EPU = 8000 horas de EPU × 0,00925 USD = 74 USD
    Cargos mensuales por el modo aprovisionado de ESM: 74 USD

    Cargos totales
    Cargos totales = cargos por computación + cargos por solicitudes + cargos por el modo aprovisionado de ESM
    Cargos totales = 500 USD + 6 USD + 74 USD = 580 USD

  • Suponga que es un proveedor global de soluciones para centros de contacto y que cuenta con canalizaciones que generan metadatos relacionados con la experiencia de llamadas hacia decenas de temas de Amazon MSK (Kafka), cada uno ingiriendo mensajes provenientes de distintos productos. Cada tema ingiere hasta 500 mensajes por segundo, con un tamaño promedio de 3 KB por mensaje y picos de hasta 1,5 MB/s. Dado que el tráfico puede ser irregular y difícil de predecir, desea utilizar el modo aprovisionado para ESM con el fin de ajustar con precisión el rendimiento de ESM. Suponga que la función de Lambda que procesa estos mensajes está configurada con 1024 MB de memoria para procesadores x86 y que procesa 1 millón de invocaciones por día, con una duración promedio de 0,2 segundos por invocación. Creó 10 ESM de Kafka para el procesamiento de eventos, cada uno con un rendimiento inferior a 1,5 MB/s, y decidió agruparlos en el mismo grupo de sondeadores para optimizar los costos. Suponga que activó el modo aprovisionado para ESM con el sondeador de eventos predeterminado (1 sondeador de eventos) y que utiliza 10 ESM dentro del mismo grupo de sondeadores en la región este de EE. UU. (norte de Virginia).

    Cargos de computación mensuales
    El precio de mensual por computación es de 0,0000166667 USD por GB-s, y el nivel gratuito ofrece 400 000 GB-s
    Computación total (segundos) = 1 000 000 * 30 * 0.2 segundos = 6 000 000 segundos
    Computación total (GB-s) = 6 000 000 * 1024 MB/1024 = 6 000 000 GB-s
    Computación total (GB-s) para los 10 ESM = 6 000 000 GB-s * 10 = 60 000 000 GB-s
    Cargos mensuales por computación = 60 000 000 * 0,0000166667 USD = 1000 USD
    Cargos de solicitudes mensuales
    El precio de solicitud mensual es de 0,20 USD por millón de solicitudes.
    Solicitudes mensuales totales para los 100 ESM = 1 millón × 30 días × 10 ESM = 300 millones de solicitudes
    Cargos de solicitudes mensuales = 300 millones de solicitudes * 0,20 USD = 60,00 USD
    Modo aprovisionado mensual para cargos de ESM
    El precio por hora de las EPU es de 0,185 USD y cada EPU admite 10 sondeadores de eventos.
    Sondeadores de eventos totales por hora = 1 sondeador de eventos × 10 ESM = 10 sondeadores de eventos
    EPU utilizados = 10 sondeadores de eventos utilizados/10 sondeadores de eventos admitidos por EPU = 1 EPU
    Total de EPU por mes = 1 EPU * 720 horas por mes = 720 EPU-horas
    Cargos de EPU = 720 horas de EPU * 0,185 USD = 133.2 USD
    Modo aprovisionado mensual correspondiente a cargos de ESM = 133,2 USD
    Cargos totales
    Cargos totales = cargos por computación + cargos por solicitudes + cargos de modo aprovisionado para ESM
    Cargos totales = 1000 USD + 60 USD + 133,2 USD = 1193,2 USD al mes por 10 ESM
    Costos mensuales por ESM = 1193,2 USD/10 = 119,3 USD al mes por ESM

Transferencia de datos y otros cargos

Transferencia de datos
Los datos que se transfieren tanto desde como hacia las funciones de AWS Lambda desde fuera de la región en la que se ejecutan se cobrarán según los precios para transferencias de datos de Amazon EC2 tal y como se describen en la sección “Transferencia de datos”.

La transferencia de datos con AWS Lambda Functions es gratuita en la misma región de AWS entre los siguientes servicios: Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) y Amazon SimpleDB.

El uso de Amazon Virtual Private Cloud (VPC) o emparejamiento de VPC con funciones de AWS Lambda incurrirá en cargos adicionales como se explica en la página de precios bajo demanda de Amazon Elastic Compute Cloud (EC2). Una interconexión de VPC es una conexión de redes entre dos VPC que permite enrutar el tráfico entre ellas mediante direcciones IPv4 privadas o direcciones IPv6

Cargos adicionales
Puede incurrir en cargos adicionales si su función Lambda utiliza otros servicios de AWS o transfiere datos. Por ejemplo, si su función Lambda lee y escribe datos en Amazon S3, se le facturará por las solicitudes de lectura o escritura y los datos almacenados en Amazon S3.

Para obtener más detalles sobre los precios de los servicios de AWS, consulte la sección de precios en las páginas de los productos de AWS correspondientes.

Precios de Lambda@Edge

Las funciones de Lambda@Edge se calculan con una granularidad de 1 ms

  • Si la función de Lambda@Edge se ejecuta 10 millones de veces en un mes durante 10 ms cada vez, el costo se calcularía de la siguiente manera:

    Cargos por cómputos mensuales

    El precio mensual por cómputos es de 0,00000625125 USD por 128 MB/segundo

    Cómputos totales (segundos) = 10 millones * (0,01 s) = 100 000 segundos

    Cargos por cómputos mensuales = 100 000 * 0,00000625125 USD = 0,63 USD


    Cargos de solicitudes mensuales

    El precio de solicitud mensual es de 0,60 USD por millón de solicitudes.

    Cargos de solicitudes mensuales = 10 millones * 0,6 USD/millón = 6,00 USD
     

    Cargos mensuales totales

    Cargos totales = cargos de computación + cargos de solicitud = 0,63 USD + 6,00 USD = 6,63 USD al mes

Recursos de precios adicionales

Calculadora de precios de AWS

Calcule fácilmente los costos mensuales en AWS

Obtenga asistencia de precios

Contacte a los especialistas de AWS para obtener un presupuesto personalizado