AWS Lambda

Tarification AWS Lambda

Présentation

AWS Lambda est un service de calcul sans serveur qui vous permet d’exécuter du code sans allouer ni gérer de serveurs. Créez une logique de mise à l’échelle de cluster d’application déductive, conservez les intégrations d’événements et gérez les exécutions en toute simplicité. Avec Lambda, vous pouvez exécuter du code pour pratiquement tout type d’application ou de service backend, sans aucune tâche administrative. De plus, vous ne payez que ce que vous utilisez. Vous payez en fonction du nombre de demandes pour vos fonctions et pour la durée, c’est-à-dire le temps nécessaire à l’exécution de votre code.

Lambda compte une demande chaque fois qu’elle commence à s’exécuter en réponse à une déclencheur de notification d’événement - par exemple, à partir d’Amazon Simple Notification Service (SNS) ou Amazon EventBridge -, à une appel d’invocation, comme à partir d’Amazon API Gateway ou par le kit AWS SDK. Cela comprend également des invocations de test depuis la console AWS.

La durée est calculée à partir du moment où votre code commence à s’exécuter jusqu’à ce qu’il retourne ou à sa fin ; elle est arrondie à 1 ms près*. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction. Dans le modèle de ressources AWS Lambda, vous choisissez la quantité de mémoire que vous souhaitez pour votre fonction, puis la puissance CPU et les autres ressources sont attribuées en conséquence. Une augmentation de la taille de la mémoire entraîne une augmentation équivalente du nombre de processeurs disponibles pour votre fonction. Pour en savoir plus, consultez la documentation relative à la configuration des fonctions.

Vous pouvez exécuter vos fonctions Lambda sur des processeurs qui reposent sur des architectures x86 ou Arm. Les fonctions AWS Lambda qui s'exécutent sur Graviton2, à l'aide de l'architecture de processeurs basée sur Arm et conçue par AWS, fournissent jusqu'à 34 % de rapport prix/performances en plus par rapport aux fonctions qui s'exécutent sur des processeurs x86. Cela s’applique à une variété de charges de travail sans serveur, par exemple les backends web et mobiles, les données et le traitement multimédia.

* Les frais de durée s’appliquent au code qui s’exécute dans le gestionnaire d’une fonction et au code d’initialisation déclaré en dehors du gestionnaire. Pour les fonctions Lambda avec des extensions AWS Lambda, la durée inclut également le temps nécessaire à la dernière exécution du code pour terminer l’exécution durant la phase d’interruption. Pour les fonctions Lambda configurées avec SnapStart, la durée inclut également le temps nécessaire au chargement de l’environnement d’exécution, tout code exécuté dans un hook d’exécution et le code d’initialisation exécuté lors de la création de copies d’instantanés créées pour la résilience. Pour plus de détails, consultez la documentation Modèle de programmation Lambda.

Le niveau d’offre gratuite AWS Lambda comprend au total un million de demandes gratuites et 400 000 Go secondes de temps de calcul par mois, utilisables pour les fonctions à technologie de processeurs x86 et Graviton2, en agrégat. De plus, le niveau gratuit inclut 100 Go de streaming de réponse HTTP par mois, au-delà des six premiers Mo par demande, qui sont gratuits. Lambda propose également des options de tarification progressive pour la durée à la demande supérieure à certains seuils d'utilisation mensuelle. AWS Lambda fait partie des Compute Savings Plans, un modèle de tarification flexible qui permet une utilisation d'Amazon Elastic Compute Cloud (Amazon EC2), d'AWS Fargate et Lambda à prix avantageux en échange d'un engagement à une consommation régulière (mesurée en USD/heure) sur une période d'un ou trois ans. Avec les Compute Savings Plans, vous pouvez économiser jusqu'à 17 % sur AWS Lambda. Les Savings s’appliquent à la durée et à la simultanéité allouée. En savoir plus

people at desk

Calculateur de prix AWS

Calculez le coût de votre AWS Lambda et de votre architecture en une seule estimation.

Créez votre estimation personnalisée maintenant

hands with calculator

Tarification AWS Lambda

Fonctions Lambda (par défaut)

Événement asynchrone (y compris les événements provenant de S3, SNS, EventBridge, StepFunctions, journaux Cloudwatch) : une demande vous est facturée pour chaque événement asynchrone pour les 256 premiers Ko. Les données utiles individuelles supérieures à 256 Ko sont facturées 1 requête supplémentaire pour chaque bloc de 64 Ko jusqu’à 1 Mo.

Le coût de la durée est fonction de la quantité de mémoire que vous attribuez à votre fonction. Vous pouvez allouer n’importe quelle quantité de mémoire (entre 128 Mo et 10 240 Mo) à votre fonction, et ceci par tranches de 1 Mo. Le tableau ci-dessous contient quelques exemples du prix par ms associé à différentes tailles de mémoire, pour une utilisation dans les limites du premier niveau de tarification, par exemple jusqu’à 6 milliards de Go-secondes par mois dans la région USA Est (Ohio)

  • Prix x86
  • Prix (Arm)

Les niveaux de tarification de durée à la demande Lambda sont appliquées à la durée mensuelle regroupée des fonctions s'exécutant sur la même architecture (x86 ou Arm, respectivement), dans la même région, au sein du compte. Si vous faites appel à la facturation consolidée dans AWS Organizations, les niveaux de tarification sont appliqués à la durée mensuelle regroupée de vos fonctions s’exécutant sur la même architecture, dans la même région, sur les différents comptes de l’organisation.

Lambda Managed Instances

Les instances gérées Lambda vous permettent d’exécuter des fonctions Lambda sur des instances EC2 entièrement gérées dans votre VPC, en combinant l’expérience de développement sans serveur de Lambda avec la rentabilité et la flexibilité matérielle d’EC2. Cette caractéristique est idéale pour les charges de travail stables et à volume élevé dans lesquelles vous souhaitez optimiser les coûts tout en préservant la simplicité opérationnelle de Lambda.

Avec les instances gérées Lambda, vous pouvez choisir parmi une grande variété de types d’instances EC2 de génération actuelle en fonction de vos exigences en matière de charge de travail, bénéficier des options tarifaires EC2, notamment des EC2 Instance Savings Plans, des Compute Savings Plans et des instances réservées, et traiter plusieurs demandes simultanément dans le même environnement d’exécution afin de maximiser l’utilisation des ressources. Lambda gère automatiquement le provisionnement, la mise à l’échelle, l’application de correctifs et la gestion du cycle de vie des instances, tout en conservant le modèle de programmation Lambda habituel et une intégration fluide avec des sources d’événements telles que SQS, Kinesis et Kafka.

Tarification :
La tarification des instances gérées Lambda comporte trois éléments :

1. Frais de demande : 0,20 USD par million de demandes
2. Frais de gestion informatique  : prime de 15 % sur le prix des instances à la demande EC2 pour les instances provisionnées et gérées par Lambda (Premium pour chaque type d’instance indiqué ci-dessous)
3. Frais d’instance EC2  : la tarification standard des instances EC2 s’applique aux instances provisionnées par votre fournisseur de capacité. Vous pouvez réduire les coûts en utilisant des Compute Savings Plans, des instances réservées ou d’autres options tarifaires EC2

Notez que les fonctions Lambda Managed Instances ne seront pas payées séparément pour la durée d’exécution de chaque requête, contrairement aux fonctions de type de calcul Lambda (par défaut).

Mappages des sources d’événements : pour les charges de travail utilisant des unités EPU (Event Poller Units) provisionnées avec des sources d’événements telles que Kafka ou SQS, le prix EPU standard de 0,00925 USD par EPU-heure s’applique.

  • Supposons que vous utilisiez un service d’API à trafic élevé qui traite 100 millions de demandes par mois avec une durée moyenne de 200 ms par demande. Vous configurez votre fournisseur de capacité d’instance gérée Lambda pour utiliser des instances m7g.xlarge (4 processeurs virtuels, 16 Go de mémoire, Graviton3) et utilisez un plan d’économies de calcul sur 3 ans pour des économies de coûts maximales.

    Frais mensuels

    Frais pour les requêtes
    Demandes mensuelles : 100 millions de demandes
    Prix de la demande : 0,20 USD par million de demandes
    Frais mensuels pour les requêtes 100 millions / 1 million * 0,20 USD = 20 USD

    Frais pour le calcul
    Type d’instance : m7g.xlarge
    Prix à la demande EC2 : 0,1632 USD par heure (États-Unis, est de la Virginie du Nord)
    Avec une réduction de trois ans sur le plan d’économies informatiques (72 %) : 0,0457 USD de l’heure
    Estimation du nombre d’heures d’instance nécessaires : environ 2 000 heures par mois (sur la base du modèle de charge de travail et de la multisimultanéité)
    Frais mensuels d’instance EC2 : 2 000 × 0,0457 USD = 91,40 USD

    Frais de gestion
    Frais de gestion : 15 % du prix à la demande de l’EC2
    Frais de gestion par heure : 0,1632 USD × 0,15 = 0,02448 USD par heure
    Frais de gestion mensuels : 2 000 × 0,02448 USD = 48,96 USD

    Frais mensuels totaux
    Total des frais = frais de demande + frais d’instance EC2 + frais de gestion
    Total des frais = 20 USD + 91.40 USD + 48.96 USD = 160,36 USD

Tarification de l’isolation des locataires

Activez le mode d’isolation des locataires pour isoler le traitement des demandes pour les utilisateurs finaux individuels ou les locataires qui invoquent votre fonction Lambda. Les environnements d’exécution sous-jacents d’une fonction Lambda isolée du locataire sont toujours associés à un locataire particulier et ne sont jamais utilisés pour exécuter des requêtes provenant d’autres locataires invoquant la même fonction. Cette fonctionnalité simplifie le développement et la maintenance d’applications multi-locataires qui traitent du code ou des données spécifiques aux locataires avec des exigences d’isolation strictes pour tous les locataires. Lorsque Lambda crée un nouvel environnement d’exécution isolé du locataire pour répondre à une demande, vous êtes facturé, en fonction de la quantité de mémoire que vous allouez à votre fonction et de l’architecture du processeur que vous utilisez. Pour en savoir plus sur la capacité d’isolation des locataires de Lambda, consultez la documentation.

  • Application SaaS à locataires multiples

    Supposons que vous construisiez une plate-forme d’automatisation qui exécute le code fourni par l’utilisateur en réponse à des événements. Par exemple, une équipe informatique peut souhaiter exécuter un flux de travail automatisé lorsqu’un nouvel employé rejoint son organisation ou est transféré d’un service à l’autre. Autre exemple, une équipe DevOps peut souhaiter déclencher un flux de travail CI/CD lorsqu’un développeur apporte des modifications de code à son référentiel de code source. Votre plateforme d’automatisation est multilocataire, ce qui signifie qu’elle dessert plusieurs utilisateurs finaux. Parce que vous vous attendez à une forte variation de la demande, selon l’heure et pour chaque utilisateur final ou locataire, vous créez votre plateforme à l’aide de services sans serveur, notamment AWS Lambda.

    Votre plateforme d’automatisation permet d’exécuter du code fourni par l’utilisateur en réponse à des événements. Comme vous ne contrôlez pas le code fourni par les utilisateurs, vous activez le mode d’isolation des locataires pour garantir que les appels de fonctions Lambda pour chaque utilisateur final sont traités dans des environnements d’exécution distincts, isolés les uns des autres.

    Supposons que vous ayez configuré votre fonction Lambda avec 1 024 Mo de mémoire et une architecture CPU x86. Au cours d’un mois normal, votre fonction traite 10 millions d’appels avec une durée moyenne de 2 secondes par appel. Votre plateforme SaaS est utilisée par 1 000 utilisateurs finaux ou locataires. Pour simplifier, supposons qu’en moyenne chaque locataire génère 10 000 appels par mois et que Lambda crée 200 environnements d’exécution par locataire (soit un taux de démarrage à froid de 2 % par locataire).

    Vos frais seront calculés comme suit :

    Frais pour les requêtes
    Votre fonction s’exécute 10 millions de fois par mois.

    Frais de requêtes mensuels = 10 millions * 0,2 USD/million = 2 USD

    Frais pour le calcul
    Par mois, votre fonction s’exécute 10 millions de fois avec une durée moyenne de 2 secondes. La mémoire configurée pour votre fonction est de 1 024 Mo.

    Durée de calcul mensuelle (secondes) : 10 M * 2 s = 20 millions de secondes
    Calcul mensuel (Gbit/s) : 20 millions de secondes * 1 024 Mo/1 024 Mo = 20 millions de Go
    Frais de calcul mensuels = 20 millions * 0.0000166667 = 333,34 USD

    Frais d’isolement des locataires
    Chaque mois, en moyenne, votre fonction dessert 1 000 locataires uniques. Chaque locataire invoque la fonction 10 000 fois avec une moyenne de 200 environnements d’exécution créés par locataire (soit un taux de démarrage à froid moyen de 2 % pour chaque locataire).

    Environnements d’exécution mensuels créés pour 1 000 locataires : 200 * 1 K = 200 000
    Frais mensuels d’isolation des locataires : 200 000 USD * 0,000167 USD * 1 024 Mo/1 024 Mo = 33,4 USD

    Frais mensuels totaux
    Total des frais = Frais de demande + Frais de calcul + Frais d’isolation des locataires
    Total des frais = 2 USD + 333.34 USD + 33.4 USD = 368,74 USD

Tarification du magasin éphémère Lambda

Le coût du magasin éphémère dépend de la quantité de magasin éphémère que vous allouez à votre fonction et de la durée d’exécution de la fonction, mesurée en millisecondes. Vous pouvez allouer n’importe quelle quantité de stockage supplémentaire à votre fonction entre 512 Mo et 10 240 Mo, par incréments de 1 Mo. Vous pouvez configurer le magasin éphémère pour les fonctions exécutées aussi bien sur les architectures x86 et Arm. 512 Mo de magasin éphémère sont disponibles pour chaque fonction Lambda sans frais supplémentaires. Vous ne payez que pour le magasin éphémère supplémentaire que vous configurez.

Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).

Tarification pour la simultanéité allouée

Vous pouvez activer la simultanéité allouée pour vos fonctions Lambda afin de mieux contrôler les performances de vos applications sans serveur. Lorsqu'elle est activée, la simultanéité allouée conserve les fonctions initialisées et hyperprêtes à réagir en millisecondes à deux chiffres. Vous payez le montant de la simultanéité que vous configurez ainsi que le temps de configuration. Dès que la simultanéité allouée est activée pour votre fonction et que vous l'exécutez, vous payez également pour les requêtes et la durée aux prix indiqués ci-dessous. Si votre fonction dépasse la simultanéité configurée, vous êtes facturé pour l’exécution des fonctions excédentaires aux prix indiqués dans la section Tarification AWS Lambda ci-dessus. Vous pouvez activer la simultanéité allouée pour les fonctions qui s'exécutent sur les architectures x86 et Arm. Pour en savoir plus sur la simultanéité allouée, consultez la documentation.

La simultanéité allouée est calculée entre le moment où vous l'activez sur votre fonction et celui de sa désactivation. Sa valeur est arrondie à 5 minutes près. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction et de la quantité de simultanéité que vous configurez sur celle-ci. La durée est calculée à partir du moment où votre code commence à s'exécuter jusqu'à ce qu'il retourne ou à sa fin ; elle est arrondie à 1 ms près**. Le prix est fonction de la quantité de mémoire que vous attribuez à votre fonction.

** Les frais de durée s'appliquent au code qui s'exécute dans le gestionnaire d'une fonction et au code d'initialisation déclaré en dehors du gestionnaire. Pour les fonctions Lambda avec des extensions AWS Lambda, la durée inclut également la durée nécessaire à la dernière exécution du code pour terminer l'exécution durant la phase d'interruption. Pour les fonctions configurées avec la simultanéité allouée, AWS Lambda recycle périodiquement les environnements d'exécution et réexécute votre code d'initialisation. Pour plus de détails, consultez la documentation Modèle de programmation Lambda.

L'offre gratuite pour Lambda ne concerne pas les fonctions pour lesquelles la simultanéité allouée est activée. Si vous activez la simultanéité allouée pour votre fonction et que vous l'exécutez, vous serez facturé pour les requêtes et la durée sur la base du prix indiqué ci-dessous.

Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).

  • Supposons que vous êtes un développeur d'appli mobile et que vous êtes en train de créer une application mobile de commande de nourriture. Les clients peuvent utiliser l'application pour commander de la nourriture depuis un emplacement de restaurant précis, recevoir des mises à jour de l'état de la commande et emporter leur commande une fois qu'elle est prête. Étant donné vos prévoyez une hausse de la variation de la demande de votre application, en fonction du moment de la journée et de l'emplacement du restaurant, vous créez votre backend mobile à l'aide de services sans serveur, notamment AWS Lambda.

    Pour des besoins de simplicité, supposons que votre application traite trois millions de requêtes par mois. La
    durée moyenne d'exécution de la fonction, dans ce cas, est de 120 ms. Votre fonction est configurée avec 1 536 Mo de mémoire et sur un processeur basé sur une architecture x86.

    Vous lancez la nouvelle version de votre application mobile, qui est d'ailleurs fortement commercialisée. Vous prévoyez un pic de la demande, de la période allant de midi à 20 heures, pendant la journée de lancement. Vous souhaitez que votre application mobile réagisse même lorsque la demande augmente et diminue rapidement, ce qui vous permet d'activer la simultanéité allouée sur vos fonctions Lambda. La simultanéité allouée est définie à 100.

    Pendant huit heures, vos fonctions reçoivent 500 000 requêtes. La durée moyenne
    d'exécution de la fonction lorsque la simultanéité allouée est activée est de 100 ms. Pendant le reste du mois, votre application reçoit 2,5 millions de requêtes en plus et vos fonctions s'exécutent en réponse à celles-ci sans que la simultanéité allouée ne soit activée.

    Vos frais seront calculés comme suit :

    Frais pour la simultanéité allouée :
    Le prix de la simultanéité allouée est facturé 0,0000041667 USD par GO
    La période totale pendant laquelle la simultanéité allouée est activée (secondes) = 8 heures x 3 600 secondes = 28 800 secondes
    Total pour la simultanéité configurée (Go) : 100 x 1 536 Mo/1 024 Mo = 150 Go
    Total pour la simultanéité allouée (GO) : 150 Go x 28 800 secondes = 4 320 000 GO
    Frais pour la simultanéité allouée : 4,32 millions de GO x 0,0000041667 USD = 18 USD

    Frais pour les requêtes :
    Le prix de la requête mensuel est de 0,20 USD par million de requêtes et l'offre gratuite fournit un million de requêtes par mois.
    Nombre total de requêtes – Nombre de requêtes comprises dans l'offre gratuite = nombre de requêtes facturables par mois
    3 000 000 de requêtes – 1 000 000 de requêtes comprises dans l'offre gratuite = 2 000 000 de requêtes facturables par mois
    Frais mensuels pour les requêtes = 2 x 0,20 USD = 0,40 USD

    Frais mensuels pour le calcul lorsque la simultanéité allouée est activée :
    Le prix applicable au calcul est de 0,0000097222 USD par GO
    Durée totale du calcul (secondes) = 500 000 x 100 ms = 50 000 secondes
    Durée totale du calcul (GO) = 50 000 secondes x 1 536 Mo/1 024 Mo = 75 000 GO.
    Frais de calcul mensuels = 75 000 GO x 0,0000097222 USD = 0,73 USD

    Frais mensuels pour le calcul lorsque la simultanéité allouée est désactivée :
    Le prix de calcul mensuel revient à 0,0000166667 USD par GO et l'offre gratuite fournit 400 000 GO.
    Taux de calcul total (en secondes) = 2,5 millions x 120 ms = 300 000 secondes
    Durée totale du calcul (GO) = 300 000 x 1 536 Mo/1 024 Mo = 450 000 GO
    Total pour le calcul – Valeur de l'offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en GO)
    450 000 GO – 400 000 GO (offre gratuite) = 50 000 GO
    Frais de calcul mensuels = 50 000 x 0,0000166667 USD = 0,83 USD

    Frais mensuels totaux :
    Total des frais = Frais de la simultanéité allouée + Frais de la requête + Frais de calcul lorsque la simultanéité allouée est activée + Frais de calcul lorsque la simultanéité allouée est désactivée
    Total des frais = 18 USD + 0,40 USD + 0,73 USD + 0,83 USD = 19,96 USD

  • Supposons que vous êtes un détaillant qui organise une grande vente pendant le Cyber Monday, un jour férié aux États-Unis, dédié au e-commerce et qui a lieu le lundi qui suit Thanksgiving. Vos clients peuvent échanger en temps réel avec le support client au moyen de l'application mobile fournie à cet effet. Vous décidez de déployer un modèle de traitement du langage naturel (NLP).

    Dans ce cas, vous utilisez le modèle populaire BERT (Bidirectional Encoder Representations from Transformers) disponible dans AWS Lambda. Ce modèle vous aide à analyser et à comprendre les interactions du service client grâce à l'application mobile, de manière à afficher du contenu d'assistance pertinent ou à acheminer le client vers l'agent de service client approprié. Vous recevez des demandes d'assistance client beaucoup plus élevées que d'habitude pendant cette vente. Vous décidez donc d'activer la simultanéité allouée sur vos fonctions Lambda pour que votre application réponde rapidement même en cas de pic de trafic.

    Supposons que vos fonctions reçoivent deux millions de requêtes pendant les 24 heures suivant cette vente et que la simultanéité allouée est activée. Dans ce cas, la durée moyenne d'exécution de la fonction est de 280 ms. Votre fonction est configurée avec 4,096 Mo de mémoire, sur un processeur basé sur x86, et la simultanéité allouée est défini à 7.

    Vos frais seront calculés comme suit :

    Frais pour la simultanéité allouée :
    Le prix de la simultanéité allouée est facturée 0,0000041667 USD par GO.
    La période totale pendant laquelle la simultanéité allouée est activée (secondes) = 24 heures x 3 600 secondes = 86 400 secondes
    Le total de la simultanéité configurée (GO) : 7 x 4 096 Mo/1 024 Mo = 28 GO
    Total pour la simultanéité allouée (GO) = 28 Go x 86 400 secondes = 2 419 200 GO
    Frais pour la simultanéité allouée = 2 419 200 GO x 0,0000041667 USD = 10,08 USD

    Frais mensuels pour le calcul lorsque la simultanéité allouée est activée :
    Le prix applicable au calcul est de 0,0000097222 USD par GO.
    Durée totale du calcul (secondes) = 2 000 000 x 280 ms = 560 000 secondes
    Durée totale du calcul (GO) = 560 000 secondes x 4 096 Mo/1 024 Mo = 2 240 000 GO.
    Frais de calcul mensuels = 2 240 000 GO x 0,0000097222 USD = 21,78 USD

    Frais de requêtes mensuels :
    Le prix mensuel pour les requêtes est de 0,20 USD par million de requêtes
    Frais de requêtes mensuels = 2 M * 0,2 USD/M = 0,40 USD

    Frais mensuels totaux :
    Frais totaux = Frais de la simultanéité allouée + Frais de calcul lorsque la simultanéité allouée est activée + Frais de la requête = 10,08 USD + 21,78 USD + 0,40 USD = 32,26 USD

Tarification de SnapStart

SnapStart peut améliorer les performances de start-up de quelques secondes à moins d'une seconde pour les applications sensibles à la latence. SnapStart fonctionne en capturant l'état initialisé de la mémoire (et du disque) de votre fonction et en mettant en cache cet instantané pour un accès à faible latence. Lorsque votre fonction est ensuite invoquée, Lambda reprend les environnements d'exécution à partir de cet instantané pré-initialisé au lieu de les initialiser à partir de zéro, ce qui améliore la latence de start-up.

Un instantané est créé chaque fois que vous publiez une nouvelle version de votre fonction avec SnapStart activé. La mise en cache d'un instantané vous est facturée à la période pendant laquelle la version de votre fonction est active, pendant au moins 3 heures et par milliseconde par la suite. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction. Vous êtes également facturé chaque fois que Lambda reprend un environnement d'exécution en restaurant votre instantané, le prix dépendant de la quantité de mémoire que vous allouez à votre fonction.

La tarification de SnapStart ne s'applique pas aux exécutions gérées par Java prises en charge.

  • Imaginons que vous êtes une entreprise de logistique disposant d'une flotte de véhicules sur le terrain, dont chacun est doté de capteurs et d'une connectivité 4G/5G permettant d'émettre des données télémétriques à l'intérieur d'un flux de données Amazon Kinesis. Vous souhaitez utiliser des modèles de machine learning (ML) que vous avez développé pour inférer l'état du véhicule et prédire à quel moment une maintenance d'un composant en particulier est nécessaire.

    Supposons que vous possédez 10 000 véhicules sur le terrain et que chacun émette des données télémétriques une fois par heure de manière échelonnée avec suffisamment de gigue. Vous envisagez d'effectuer cette inférence sur chaque charge utile pour vous assurer que les véhicules sont immédiatement programmés pour la maintenance et ainsi garantir un état optimal de votre flotte de véhicules.

    Supposons que le modèle ML comprend la fonction et que sa taille est de 512 Mo. Pour l'inférence, votre fonction est configurée avec 1 Go de mémoire et son exécution facturée prend deux secondes en moyenne sur un processeur basé sur x86. Vous gérez une version unique de votre fonction. Pour simplifier, supposons que 1 % de toutes les requêtes aboutissent à la création de nouveaux environnements d'exécution.

    Vous remarquez que le traitement de bout en bout prend plusieurs secondes pour ces 1 % de demandes. Cela est dû au fait que l'initialisation de votre fonction prend plusieurs secondes, car vous importez des modules logiciels volumineux et le modèle de machine learning lors de l'initialisation. Vous souhaitez réduire le temps de traitement de bout en bout de ces demandes. Vous devez donc activer SnapStart sur votre fonction et publier une nouvelle version.

    Vos frais seront calculés comme suit :

    Frais pour les requêtes
    La fonction Lambda traite chaque mois 10 000 x 24 x 31 = 7 440 000 messages émis par les véhicules.

    Frais de requêtes mensuels : 7,44 M x 0,20 USD/M = 1,49 USD

    Frais de calcul mensuels
    Votre fonction sera exécutée une fois par message toutes les deux secondes, et ce, une fois par mois.

    Durée mensuelle du calcul (secondes) : 7,44 millions x 2 secondes = 14,88 millions de secondes
    Calcul mensuel (Go/s) : 14,88 millions de secondes x 1024 Mo/1024 Mo = 14,88 millions de Go/s
    Frais mensuels pour le calcul : 14,88 millions de Go/s x 0,0000166667 USD = 248,00 USD

    Frais de SnapStart :

    Durée totale pendant laquelle la version de la fonction est active (secondes) : 24 heures x 31 jours x 3600 secondes = 2 678 400 secondes
    Mémoire de fonction allouée : 1024 Mo/1024 Mo -> 1 Go
    Cache SnapStart utilisé au total : 1 Go x 2 678 400 s -> 2 678 400 Go/s
    Frais de cache SnapStart : 2,68 millions de Go/s x 0,0000015046 USD = 4,03 USD

    Nombre de requêtes utilisant SnapStart Restore : 1 % de 7,44 millions = 74 400
    Restauration SnapStart totale utilisée : 74 400 x 1 Go = 74 400 Go
    Frais de restauration de SnapStart : 74 400 Go x 0,0001397998 USD = 10,4 USD

    Frais totaux de SnapStart : frais de cache de SnapStart + frais de restauration de SnapStart
    Frais totaux de SnapStart : 4,03 USD + 10,4 USD = 14,43 USD

    Frais mensuels totaux

    Frais totaux = Frais de requête + Frais de calcul + Frais de SnapStart
    Total des frais = 1,49 USD + 248,00 USD + 14,43 USD = 263,92 USD

Tarification du flux de réponse HTTP Lambda

Les fonctions AWS Lambda peuvent renvoyer un flux de réponse HTTP lorsqu'elles sont invoquées via l'API InvokeWithResponseStream ou via une URL de fonction à l'aide du mode d'appel ResponseStream. Le streaming de réponses HTTP peut améliorer les performances du délai d'obtention du premier octet et prend en charge des charges utiles supérieures à 6 Mo. Lorsque vous utilisez le streaming de réponses HTTP, vous êtes facturé pour chaque Go écrit dans le flux de réponse par votre fonction. Vous pouvez diffuser gratuitement les 6 premiers Mo à la demande.

Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).

Tarification du mode provisionné pour le mappage des sources d’événements (ESM)

Le mode provisionné pour l’ESM vous permet d’optimiser le débit de votre ESM en allouant un nombre minimum et maximum de ressources nommées interrogateurs d’événements, et en effectuant une mise à l’échelle automatique entre les limites minimale et maximale configurées. Un interrogateur d’événements est la ressource configurable qui sous‑tend un ESM en mode provisionné. La tarification est basée sur le nombre minimum d’interrogateurs d’événements provisionnés et sur ceux consommés lors de la mise à l’échelle automatique. Les frais sont calculés à l’aide d’une unité de facturation nommée unité d’interrogateur d’événements (EPU). Les frais sont calculés en fonction du nombre et de la durée des EPU utilisées, en heure d’unité d’interrogateur d’événements (h‑EPU).

SQS ESM : un EPU prend en charge un sondeur d’événements, chacun fournissant un débit allant jusqu’à 1 Mo/s. Chaque SQS ESM nécessite un minimum de deux sondeurs.

MSK ou ESM autogéré Kafka (SMK) : chaque EPU prend en charge une capacité de débit allant jusqu’à 20 Mo/s pour les sondages d’événements, avec une valeur par défaut de 10 sondeurs d’événements. Chaque sondeur d’événements peut augmenter le débit jusqu’à 5 Mo/s. Le nombre de sondeurs d’événements alloués à une EPU dépend de la capacité de calcul consommée par chaque sondeur d’événements. Vous pouvez regrouper plusieurs ESM au sein du même Amazon VPC afin de partager la capacité et les coûts de l’EPU. Pour en savoir plus sur le mode provisionné pour Kafka ESM, consultez la documentation

Transfert de données : les frais sont facturés conformément aux frais de transfert de données AWS standards.

Durée : la tarification est calculée à la seconde, avec un minimum d’une minute.

  • Exemple : analyse de données de streaming en temps réel avec Kafka

    Supposons que vous soyez un fournisseur mondial de solutions de centre de contact client et que vous disposiez de pipelines qui transmettent des métadonnées relatives à l’expérience d’appel vers des rubriques Amazon MSK (Kafka) à des fins d’analyse en temps réel. Étant donné que le trafic peut connaître des pics et être imprévisible, vous souhaitez utiliser le mode provisionné pour ESM afin d’optimiser les performances de votre ESM. Supposons que votre fonction Lambda qui traite ces messages soit configurée avec 1 024 Mo de mémoire pour un processeur x86 et doive gérer un million d’invocations par jour d’une durée moyenne de deux secondes. Supposons également que vous ayez activé le mode provisionné pour votre ESM avec l’option par défaut d’un unique interrogateur d’événements, et que votre ESM augmente verticalement jusqu’à consommer 800 h‑EPU par mois dans la région USA Est (Virginie du Nord).

    Frais de calcul mensuels
    La tarification de calcul mensuel est de 0,0000166667 USD par Go/s, et l’offre gratuite fournit 400 000 Go/s
    Calcul total (secondes) = 1 000 000 * 30 * 2 secondes = 60 000 000 secondes
    Calcul total (Go/s) = 60 000 000 * 1 024 Mo/1024 = 60 000 000 Go/s
    Calcul total – Valeur de l’offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en Go/s)
    60 000 000 Go/s – 400 000 Go/s offerts = 59 600 000 Go/s
    Frais de calcul mensuels = 59 600 000 * 0,0000166667 USD = 993,3 USD

    Frais de requêtes mensuels
    Le tarif mensuel pour les requêtes correspond à 0,20 USD par million de requêtes.
    Frais mensuels de requêtes = 60 millions de requêtes * 0,20 USD = 12,00 USD

    Frais mensuels du mode provisionné pour ESM
    Frais EPU = 800 h‑EPU * 0,185 USD = 148 USD
    Frais mensuels du mode provisionné pour ESM = 148 USD

    Total des frais
    Total des frais = Frais de calcul + Frais de requêtes + Frais du mode provisionné pour ESM
    Total des frais = 993,3 USD + 12 USD + 148 USD = 1 153,3 USD

     

  • Exemple : traitement des événements en temps réel à l’aide d’Amazon SQS

    Supposons que vous soyez une société de services financiers qui traite des flux de données de marché et exécute des transactions financières à l’aide de microservices pilotés par les événements pour des applications financières en temps réel destinées aux clients. Étant donné que le trafic peut connaître des pics et être imprévisible, vous souhaitez utiliser le mode provisionné pour SQS ESM afin d’optimiser les performances de votre ESM. Supposons que votre fonction Lambda qui traite ces événements soit configurée avec 1 024 Mo de mémoire pour un processeur x86 et doive gérer un million d’invocations par jour d’une durée moyenne d’une seconde. Vous avez un TPS maximum de 100 pour les événements que vous souhaitez traiter avec une latence maximale de 0,2 seconde. Pour atteindre ces performances de latence, vous avez activé le mode Provisioned pour votre SQS ESM avec un minimum de 10 sondeurs d’événements, et votre ESM peut évoluer jusqu’à consommer 8 000 EPU-heures par mois dans la région USA EST (Virginie du Nord) afin de gérer votre trafic à faible latence.

    Frais de calcul mensuels
    Le tarif mensuel pour le calcul est de 0,0000166667 USD par Go-s
    Calcul total (secondes) = 1 000 000 * 30 * 1 secondes = 30 000 000 secondes
    Calcul total (Go/s) = 30 000 000 * 1024 Mo/1024 = 30 000 000 Go/s
    Calcul total = Valeur facturable pour le calcul par mois (en Go/s) * 0.0000166667 USD
    Frais de calcul mensuels = 30 000 000 * 0,0000166667 USD = 500 USD

    Frais de requêtes mensuels
    Le prix mensuel pour les requêtes est de 0,20 USD par million de requêtes
    Frais mensuels pour les requêtes = 30 millions de requêtes * 0,20 USD = 6 USD

    Frais mensuels du mode provisionné pour ESM = 148 USD
    Le prix de l’EPU est de 0,00925 USD par EPU-heure
    Frais EPU = 8000 h‑EPU * 0,00925 USD = 74 USD
    Frais mensuels du mode provisionné pour ESM = 74 USD

    Total des frais
    Total des frais = Frais de calcul + Frais de requêtes + Frais du mode provisionné pour ESM
    Total des frais = 500 USD + 6 USD + 74 USD = 580 USD

  • Supposons que vous soyez un fournisseur mondial de solutions de centre de contact client et que vous disposiez de pipelines qui transmettent des métadonnées relatives à l’expérience d’appel vers des dizaines de rubriques Amazon MSK (Kafka), chacun ingérant des messages provenant de vos différents produits. Chaque rubrique est ingérée avec un maximum de 500 messages par seconde, avec une taille de message moyenne de 3 Ko et un débit maximal de 1,5 Mo/s. Étant donné que le trafic peut connaître des pics et être imprévisible, vous souhaitez utiliser le mode provisionné pour ESM afin d’optimiser les performances de votre ESM. Supposons que votre fonction Lambda qui traite ces messages soit configurée avec 1 024 Mo de mémoire pour un processeur x86 et doive gérer un million d’invocations par jour d’une durée moyenne de 0.2 secondes. Vous avez créé 10 ESM Kafka pour le traitement des événements avec un débit inférieur à 1,5 Mo/s par ESM, et vous avez décidé de les regrouper dans le même groupe Poller afin d’optimiser les coûts. Supposons que vous ayez activé le mode provisionné pour votre ESM avec le seul sondeur d’événements par défaut, et que vous utilisiez tous vos 10 ESM au sein du même groupe de sondeurs dans l’est des États-Unis (Virginie du Nord).

    Frais de calcul mensuels
    Le tarif de calcul mensuel revient à 0,0000166667 USD par Go-s et l’offre gratuite fournit 400 000 Go-s
    Calcul total (secondes) = 1 000 000 * 30 * 0.2 secondes = 6 000 000 secondes
    Calcul total (Go/s) = 6 000 000 * 1024 Mo/1024 = 6 000 000 Go/s
    Calcul total (Gbit/s) pour les 10 ESM = 6 000 000 Gbit/s * 10 = 60 000 000 Gbit/s
    Frais de calcul mensuels = 60 000 000 * 0,0000166667 USD = 1,000 USD
    Frais de requêtes mensuels
    Le tarif mensuel pour les requêtes correspond à 0,20 USD par million de requêtes.
    Nombre total de demandes mensuelles pour les 100 ESM = 1 million * 30 jours * 10 ESM = 300 millions de demandes
    Frais mensuels pour les requêtes = 300 millions de requêtes * 0,20 USD = 60,00 USD
    Frais mensuels du mode provisionné pour ESM
    Le prix horaire de l’EPU est de 0,185 USD de l’heure et prend en charge 10 sondeurs par EPU.
    Nombre total de personnes interrogées par heure = 1 sondeur sur les événements * 10 ESM = 10 sondeurs sur les événements
    EPU utilisé = 10 sondeurs événementiels utilisés/10 sondeurs événementiels pris en charge par EPU = 1 EPU
    Total des EPUs par mois = 1 EPU * 720 heures par mois = 720 EPU-heures
    Frais EPU = 720 h‑EPU * 0,185 USD = 133.2 USD
    Frais mensuels du mode provisionné pour ESM = 133.2 USD
    Total des frais
    Total des frais = Frais de calcul + Frais de requêtes + Frais du mode provisionné pour ESM
    Frais totaux = 1 000 USD + 60 USD + 133,2 USD = 1 193,2 USD par mois pour 10 ESM
    Coûts mensuels par ESM = 1 193,2 USD/10 = 119,3 USD par mois par ESM

Transfert de données et frais divers

Transfert de données
Les données transférées « à l’intérieur » et « à l’extérieur » de vos fonctions AWS Lambda, depuis l’extérieur de la région où elles ont été exécutées, sont facturées aux débits de transfert de données Amazon EC2 indiqués ici sous « Transfert de données ».

Le transfert de données avec les fonctions AWS Lambda est gratuit dans la même région AWS entre les services suivants : Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) et Amazon SimpleDB.

L’utilisation d’Amazon Virtual Private Cloud (VPC) ou de l’appairage de VPC, avec les fonctions AWS Lambda, entraîne des frais supplémentaires tel qu’expliqué sur la page relative à la tarification à la demande d’Amazon Elastic Compute Cloud (EC2). Une connexion d'appairage de VPC est une connexion de mise en réseau entre deux VPC qui permet d'acheminer le trafic entre ces derniers à l'aide d'adresses IPv4 ou IPv6 privées

Frais supplémentaires
Des frais supplémentaires peuvent vous être facturés si votre fonction Lambda nécessite l'utilisation d'autres services AWS ou des transferts de données. Par exemple, si votre fonction Lambda lit des données depuis Amazon S3, ou écrit des données dans Amazon S3, les demandes de lecture/écriture et les données stockées dans Amazon S3 vous seront facturées.

Pour plus de détails sur la tarification des services AWS, consultez la section Tarification de chaque service AWS concerné.

Tarification Lambda@Edge

La durée des fonctions Lambda@Edge est mesurée avec une granularité de 1 ms

Ressources de tarification supplémentaires

Calculateur de tarification AWS

Calculez facilement vos coûts mensuels avec AWS

Obtenir de l'aide pour la tarification

Contacter les spécialistes AWS pour obtenir un devis personnalisé