Amazon SageMaker aide les scientifiques des données et les développeurs à préparer, créer, entraîner et déployer rapidement des modèles de machine learning (ML) de haute qualité en rassemblant un large éventail de fonctionnalités conçues spécialement pour le ML. SageMaker prend en charge les cadres, boîtes à outils et langages de programmation de machine learning majeurs.

Avec SageMaker, vous ne payez que ce que vous consommez. Deux options de paiement vous sont proposées : la tarification à la demande (sans frais minimums ni engagements initiaux) et SageMaker Savings Plans (qui vous offre un modèle de tarification flexible basé sur l'utilisation, en échange d'un engagement sur une quantité constante d'utilisation).

Offre gratuite Amazon SageMaker

Vous pouvez essayer Amazon SageMaker gratuitement. Dans le cadre de l'offre gratuite d'AWS, vous pouvez commencer à utiliser Amazon SageMaker gratuitement. Votre offre gratuite commence à partir du premier mois où vous créez votre première ressource SageMaker. Les informations concernant l'offre gratuite d'Amazon SageMaker se trouvent dans le tableau ci-dessous.

Capacité d'Amazon SageMaker Utilisation mensuelle de l'offre gratuite pendant les 2 premiers mois
Blocs-notes Studio et instances de blocs-notes 250 heures d'utilisation des instances ml.t3.medium sur des blocs-notes Studio OU 250 heures d'utilisations des instances ml.t2.medium ou ml.t3.medium sur des instances de blocs-notes
RStudio sur SageMaker 250 heures d'utilisation des instances ml.t3.medium sur l'application RSession ET des instances ml.t3.medium gratuites pour l'application RStudioServerPro
Data Wrangler 25 heures d'instance ml.m5.4xlarge
Magasin de fonctionnalités 10 millions d'unités d'écriture, 10 millions d'unités de lecture, 25 Go de stockage (magasin en ligne standard)
Formation 50 heures d'instances m4.xlarge ou m5.xlarge
Amazon SageMaker avec TensorBoard 300 heures d'instance ml.r5.large
Inférence en temps réel 125 heures d'instances m4.xlarge ou m5.xlarge
Inférence sans serveur 150 000 secondes de durée d'inférence à la demande
Canvas 160 heures par mois pour la durée de la session
HyperPod 50 heures d'utilisation de l'instance m5.xlarge
  Utilisation mensuelle de l'offre gratuite pendant les 6 premiers mois
Expériences
100 000 enregistrements métriques ingérés par mois, 1 million d'enregistrements métriques récupérés par mois et 100 000 enregistrements métriques stockés par mois

Tarification à la demande

  • Studio classique
  • Amazon SageMaker Studio Classic
    Studio Classic propose des blocs-notes Jupyter en une étape dans le cadre de notre expérience IDE traditionnelle. Les ressources informatiques sous-jacentes sont totalement élastiques et les blocs-notes peuvent être facilement partagés avec d'autres, ce qui permet une collaboration transparente. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.

  • JupyterLab
  • Amazon SageMaker JupyterLab
    Lancez un JupyterLab entièrement géré en quelques secondes. Utilisez l'environnement de développement interactif basé sur le Web le plus récent pour les blocs-notes, le code et les données. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.

  • Éditeur de code
  • Éditeur de code Amazon SageMaker
    L'éditeur de code, basé sur Code-OSS (Visual Studio Code — Open Source), vous permet d'écrire, de tester, de déboguer et d'exécuter vos analyses et votre code ML. Il est entièrement intégré à SageMaker Studio et prend en charge les extensions IDE disponibles dans le registre d'extensions Open VSX.

  • RStudio
  • RStudio
    RStudio offre des ressources de calcul dans le cloud à la demande afin d'accélérer le développement de modèles et d'améliorer la productivité. Vous êtes facturé pour les types d'instance que vous choisissez d'exécuter sur l'application RStudio Session et l'application RStudio Server Pro.

    RStudioServerPro App

  • Instances de bloc-notes
  • Instances de bloc-notes
    Les instances de bloc-notes sont des instances de calcul qui exécutent l'application bloc-notes Jupyter. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.

  • Traitement
  • Amazon SageMaker Processing
    Amazon SageMaker Processing permet d'exécuter simplement les charges de travail de prétraitement, de post-traitement et d'évaluation du modèle sur une infrastructure entièrement gérée. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.

  • TensorBoard
  • Amazon SageMaker avec TensorBoard
    Amazon SageMaker avec TensorBoard fournit une expérience TensorBoard hébergée qui permet de visualiser et de résoudre les problèmes de convergence des modèles pour les tâches de formation Amazon SageMaker.

  • Data Wrangler
  • Amazon SageMaker Data Wrangler

    Amazon SageMaker Data Wrangler réduit, de plusieurs semaines à quelques minutes, le temps nécessaire à l'agrégation et à la préparation des données pour le machine learning. Vous payez pour le temps utilisé pour nettoyer, explorer et visualiser les données. Les clients qui utilisent des instances de SageMaker Data Wrangler sont soumis aux tarifs ci-dessous.* Les clients qui utilisent des instances d'espace de travail SageMaker Data Wrangler sur des instances d'espace de travail SageMaker Canvas sont soumis aux tarifs de SageMaker Canvas. Consultez la page de tarification de SageMaker Canvas pour plus de détails.

    Tâches Amazon SageMaker Data Wrangler

    Une tâche de Amazon SageMaker Data Wrangler est créée lorsqu'un flux de données est exporté depuis SageMaker Data Wrangler. Avec les tâches SageMaker Data Wrangler, vous pouvez automatiser vos flux de préparation de données. Les tâches SageMaker Data Wrangler vous aident à appliquer de nouveau vos flux de préparation de données sur de nouveaux jeux de données, afin de vous faire gagner du temps. Elles sont facturées à la seconde.

  • Feature Store
  • Amazon SageMaker Feature Store
    Amazon SageMaker Feature Store est un référentiel central permettant d’ingérer, de stocker et de proposer des fonctionnalités de machine learning. Les écritures, les lectures de groupes de fonctionnalités, ainsi que le stockage de données dans SageMaker Feature Store vous sont facturés, avec des tarifs différents pour la boutique en ligne standard et pour le magasin en ligne en mémoire.

     Pour le magasin en ligne standard, le stockage de données est facturé par Go et par mois. Pour le débit, vous pouvez choisir entre le mode de capacité à la demande ou le mode de capacité allouée. Pour le mode de capacité à la demande, les écritures sont facturées en unités de demande d’écriture par Ko et les lectures sont facturées en unités de demande de lecture par 4 Ko. Pour e mode de capacité allouée, vous spécifiez la capacité de lecture et d’écriture que votre application doit exiger. Sagemaker Feature Store facture une unité de capacité de lecture (WCU) pour chaque écriture par seconde (jusqu’à 1 Ko) et une RCU pour chaque lecture par seconde (jusqu’à 4 Ko). Vous serez facturé pour la capacité de débit (lectures et écritures) que vous allouez pour votre groupe de fonctionnalités, même si vous n’utilisez pas entièrement la capacité allouée.

    Pour le magasin en ligne en mémoire, les écritures sont facturées en unités de demande d’écriture par Ko avec un minimum d’une unité par écriture, les lectures sont facturées en unités de demande de lecture par Ko avec un minimum d’une unité par lecture, et le stockage de données est facturé par Go et par heure. Les frais de stockage de données minimaux sont de 5 Go (5,37 Go) par heure pour la boutique en ligne en mémoire.

  • Formation
  • Amazon SageMaker Training
    Amazon SageMaker facilite la formation des modèles de machine learning (ML) en fournissant tout ce dont vous avez besoin pour former, ajuster et déboguer les modèles. La facturation est établie en fonction de l'utilisation du type d'instance que vous choisissez. Lorsque vous utilisez Amazon SageMaker Debugger pour déboguer des problèmes et surveiller les ressources pendant la formation, vous pouvez utiliser les règles intégrées pour déboguer vos travaux de formation ou rédiger vos propres règles personnalisées. L'utilisation des règles intégrées pour déboguer vos offres de formation est gratuite. Concernant les règles personnalisées, vous êtes facturé au type d'instance que vous choisissez et en fonction de la durée d'utilisation.

  • Expériences
  • Amazon SageMaker Experiments
    Amazon SageMaker Experiments vous permet d’organiser, de suivre et de comparer vos expérimentations de ML. Vous êtes facturé pour l'ingestion, l'extraction et le stockage des enregistrements de métriques. Un enregistrement de métrique est une paire clé/valeur de données de métrique. L'ingestion et la récupération sont facturées en fonction du nombre d'enregistrements métriques. La facturation est basée sur le nombre de profils stockés par mois. Vous pouvez utiliser SageMaker Studio pour visualiser vos expériences sans frais supplémentaire.

     

    Type de frais Prix
    Ingestion 1,25 USD par million d'enregistrements métriques
    Frais d'extraction 0,25 USD par million d'enregistrements métriques
    Stockage 0,25 USD par million d'enregistrements métriques et par mois

     

  • Inférence en temps réel
  • Hébergement Amazon SageMaker : inférence en temps réel
    Amazon SageMaker fournit une inférence en temps réel pour vos cas d'utilisation nécessitant des prédictions en temps réel. La facturation est établie en fonction de l'utilisation du type d'instance que vous choisissez. Lorsque vous utilisez Amazon SageMaker Model Monitor pour conserver des modèles très précis fournissant une inférence en temps réel, vous pouvez utiliser des règles intégrées pour surveiller vos modèles ou rédiger vos propres règles personnalisées. Quant aux règles intégrées, vous bénéficiez de 30 heures de surveillance gratuite. Les frais supplémentaires seront fixés en fonction de la durée d'utilisation. Vous êtes facturé séparément lorsque vous utilisez vos propres règles personnalisées.

  • Inférence asynchrone
  • Inférence asynchrone Amazon SageMaker :
    L'inférence asynchrone Amazon SageMaker est une option d'inférence en temps quasi réel qui met les requêtes entrantes en file d'attente, puis les traite de manière asynchrone. Utilisez cette option lorsque vous devez traiter des charges utiles importantes au fur et à mesure de l'arrivée des données ou exécuter des modèles dont les temps de traitement d'inférence sont longs et qui n'ont pas d'exigences de latence inférieure à la seconde. Vous êtes facturé pour le type d'instance que vous choisissez.

  • Batch Transform
  • Amazon SageMaker Batch Transform
    Avec Amazon SageMaker Batch Transform, il n'est pas nécessaire de décomposer l'ensemble de données ni de gérer les points de terminaison en temps réel. SageMaker Batch Transform vous permet d'exécuter des prédictions sur des ensembles de données de grande ou petite capacité. Vous êtes facturé au type d'instance que vous choisissez, en fonction de la durée d'utilisation.

  • Inférence sans serveur
  • Amazon SageMaker Serverless Inference
    L'Inférence sans serveur Amazon SageMaker vous permet de déployer des modèles de machine learning pour l'inférence, sans avoir à configurer ou à gérer une quelconque infrastructure sous-jacente. Vous pouvez utiliser l’Inférence sans serveur à la demande ou ajouter une simultanéité provisionnée à votre point de terminaison pour des performances prévisibles.

    Avec l’Inférence sans serveur à la demande, vous ne payez que la capacité de calcul utilisée pour traiter les demandes d'inférence, facturées à la milliseconde, et la quantité de données traitées. Les frais de calcul dépendent de la configuration de mémoire choisie.

    Simultanéité allouée

    Éventuellement, vous pouvez aussi activer la simultanéité provisionnée pour vos points de terminaison sans serveur. La simultanéité provisionnée vous permet de déployer des modèles sur des points de terminaison sans serveur avec des performances prévisibles et une capacité de mise à l'échelle élevée en maintenant vos points de terminaison au chaud pour un nombre spécifié de demandes simultanées et pour des périodes précises. Comme pour l’inférence sans serveur à la demande, lorsque la simultanéité provisionnée est activée, vous payez en fonction de la capacité de calcul utilisée pour traiter les demandes d'inférence, facturée à la milliseconde, et de la quantité de données traitées. Vous payez également pour l'utilisation de la simultanéité provisionnée, en fonction de la mémoire configurée, de la durée accordée et de la quantité de simultanéité activée.

  • JumpStart
  • Amazon SageMaker JumpStart
    Amazon SageMaker JumpStart vous aide à démarrer rapidement et facilement avec le machine learning grâce à un accès en un clic aux ensembles de modèles courants (également appelés « Model Zoos »). JumpStart offre également des solutions de bout en bout, permettant de résoudre les cas d'utilisation ML courants, qui peuvent être personnalisés en fonction de vos besoins. L'utilisation de modèles ou des solutions JumpStart n'entraîne aucuns frais supplémentaires. Vous êtes facturé pour les heures d'instances d'entraînement et d'inférence sous-jacentes utilisées, et ce de la même manière que si vous les aviez créées manuellement.

  • Profileur
  • Le profileur Amazon SageMaker collecte des données au niveau du système pour la visualisation de tracés haute résolution du processeur et du processeur graphique. Cet outil est conçu pour aider les spécialistes de données et les ingénieurs à identifier les problèmes de performance liés au matériel dans leurs modèles de deep learning, réduisant ainsi le temps et les coûts de formation de bout en bout. Actuellement, le profileur SageMaker prend uniquement en charge le profilage des tâches de formation en utilisant les types d'instances de calcul d'entraînement ml.g4dn.12xlarge, ml.p3dn.24xlarge et ml.p4d.24xlarge.

    Régions : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Europe (Francfort), Europe (Irlande) et Israël (Tel Aviv).

    Le profileur Amazon SageMaker est actuellement en version préliminaire et est disponible gratuitement pour les clients des régions prises en charge. 

  • HyperPod
  • Amazon SageMaker HyperPod
    Amazon SageMaker HyperPod est spécialement conçu pour accélérer le développement du modèle de fondation (FM). Pour rendre l'entraînement FM plus résilient, il surveille en permanence l'état du cluster, répare et remplace les nœuds défectueux à la volée, et enregistre les points de contrôle fréquents pour reprendre automatiquement l'entraînement sans perdre de progression. SageMaker HyperPod est préconfiguré avec les bibliothèques de formation distribuées SageMaker qui vous permettent d'améliorer les performances d'entraînement FM tout en utilisant pleinement l'infrastructure informatique et réseau du cluster

Détails de l'instance

Détails du produit de l'instance Amazon SageMaker P5

Taille d'instance vCPU Mémoire d'instance (TiB) Modèle GPU GPU Mémoire GPU totale (Go) Mémoire par GPU (Go) Bande passante du réseau (Gbit/s) GPUDirect RDMA Pair à pair GPU Storage d'instance (To) Bande passante EBS (Gbit/s)
ml.p5.48xlarge 192 2 NVIDIA H100 8 640 HM3 80 3200 EFAv2   Oui NVSwitch 900 Go/s   8x3.84 NVMe SSD 80

Détails de l’instance P4d Amazon Sagemaker

Taille d'instance vCPU Mémoire d'instance (Gio) Modèle GPU GPU Mémoire GPU totale (Go) Mémoire par GPU (Go) Bande passante du réseau (Gbit/s) GPUDirect RDMA Pair à pair GPU Stockage d'instance (Go) Bande passante EBS (Go/s)
ml.p4d.24xlarge 96 1 152 NVIDIA A100 8 320 HBM 2 40 ENA et EFA 400 Oui NVSwitch 600 Go/s 8 SSD NVMe de 1000 19
ml.p4de.24xlarge 96 1 152 NVIDIA A100 8 640 HNM2e 80 400 ENA et EFA Oui NVSwitch 600 Go/s 8 SSD NVMe de 1000 19

Détail du produit de l’instance P3 Amazon Sagemaker

Taille d'instance vCPU Mémoire d'instance (Gio) Modèle GPU GPU Mémoire GPU totale (Go) Mémoire par GPU (Go) Bande passante du réseau (Gbit/s) Pair à pair GPU Stockage d'instance (Go) Bande passante EBS (Gbit/s)
ml.p3.2xlarge 8 61 NVIDIA V100 1 16 16 Jusqu'à 10 N/A EBS uniquement 1,5
ml.p3.8xlarge 32 244 NVIDIA V100 4 64 16 10 NVLink EBS uniquement 7
ml.p3.16xlarge 64 488 NVIDIA V100 8 128 16 25 NVLink EBS uniquement 14
ml.p3dn.24xlarge 96 768 NVIDIA V100 8 256 32 100 NVLink 2 disques SSD NVMe de 900 19

Détails du produit de l'instance Amazon SageMaker P2

Taille d'instance vCPU Mémoire d'instance (Gio) Modèle GPU GPU Mémoire GPU totale (Go) Mémoire par GPU (Go) Bande passante du réseau (Gbit/s) Bande passante EBS (Gbit/s)
ml.p2.xlarge 4 61 NVIDIA K80 1 12 12 Jusqu'à 10 Élevées
ml.p2.8xlarge 32 488 NVIDIA K80 8 96 12 10 10
ml.p2.16xlarge 64 732 NVIDIA K80 16 192 12 25 20

Détail du produit de l’instance G4 Amazon SageMaker

Taille d'instance vCPU Mémoire d'instance (Gio) Modèle GPU GPU Mémoire GPU totale (Go) Mémoire par GPU (Go) Bande passante du réseau (Gbit/s) Stockage d'instance (Go) Bande passante EBS (Go/s)
ml.g4dn.xlarge 4 16 NVIDIA T4 1 16 16 Jusqu'à 25 1 disque SSD NVMe de 125 Jusqu'à 3,5
ml.g4dn.2xlarge 8 32 NVIDIA T4 1 16 16 Jusqu'à 25 1 disque SSD NVMe de 125 Jusqu'à 3,5
ml.g4dn.4xlarge 16 64 NVIDIA T4 1 16 16 Jusqu'à 25 1 disque SSD NVMe de 125 4,75
ml.g4dn.8xlarge 32 128 NVIDIA T4 1 16 16 50 1 disque SSD NVMe de 900 9,5
ml.g4dn.16xlarge 64 256 NVIDIA T4 1 16 16 50 1 disque SSD NVMe de 900 9,5
ml.g4dn.12xlarge 48 192 NVIDIA T4 4 64 16 50 1 disque SSD NVMe de 900 9,5

Détail du produit de l’instance G5 Amazon SageMaker

Taille d'instance vCPU Mémoire d'instance (Gio) Modèle GPU GPU Mémoire GPU totale (Go) Mémoire par GPU (Go) Bande passante du réseau (Gbit/s) Bande passante EBS (Go/s) Stockage d'instance (Go)
ml.g5n.xlarge 4 16 NVIDIA A10G 1 24 24 Jusqu'à 10 Jusqu'à 3,5 1 x 250
ml.g5.2xlarge 8 32 NVIDIA A10G 1 24 24 Jusqu'à 10 Jusqu'à 3,5 1 x 450
ml.g5.4xlarge 16 64 NVIDIA A10G 1 24 24 Jusqu'à 25 8 1 x 600
ml.g5.8xlarge 32 128 NVIDIA A10G 1 24 24 25 16 1x900
ml.g5.16xlarge 64 256 NVIDIA A10G 1 24 24 25 16 1x1900
ml.g5.12xlarge 48 192 NVIDIA A10G 4 96 24 40 16 1x3800
ml.g5.24xlarge 96 384 NVIDIA A10G 4 96 24 50 19 1x3800
ml.g5.48xlarge 192 768 NVIDIA A10G 8 192 24 100 19 2 x 3 800

Détails du produit de l'instance Amazon SageMaker Trn1

Taille d'instance vCPU Mémoire (Gio) Accélérateurs Trainium Mémoire totale de l'accélérateur (Go) Mémoire par accélérateur (Go) Stockage d'instance (Go) Bande passante réseau (Gbit/s) Bande passante EBS (Gbit/s)
ml.trn 1,2 x large 8 32 1 32 32 1 disque SSD NVMe de 500 Jusqu'à 12,5 Jusqu'à 20
ml.trn1.32xlarge 128 512 16 512 32 4 disques SSD NVMe de 2000 800 80

Détails du produit de l'instance Amazon SageMaker Inf1

Taille d'instance vCPU Mémoire (Gio) Accélérateurs Inferentia Mémoire totale de l'accélérateur (Go) Mémoire par accélérateur (Go) Accélérateurs d'inférence Interconnexion inter-accélérateur Bande passante du réseau (Gbit/s) Bande passante EBS (Gbit/s)
ml.inf1.xlarge 4 8 1 8 8 EBS uniquement S/O Jusqu'à 25 Jusqu'à 4,75
ml.inf1.2xlarge 8 16 1 8 8 EBS uniquement S/O Jusqu'à 25 Jusqu'à 4,75
ml.inf1.6xlarge 24 48 4 32 8 EBS uniquement Oui 25 4,75
ml.inf1.24xlarge 96 192 16 128 8 EBS uniquement oui 100 19

Détails du produit de l'instance Amazon SageMaker Inf.2

Taille d'instance vCPU Mémoire (Gio) Accélérateurs Inferentia Mémoire totale de l'accélérateur (Go) Mémoire par accélérateur (Go) Accélérateurs d'inférence Interconnexion inter-accélérateur Bande passante du réseau (Gbit/s) Bande passante EBS (Gbit/s)
ml.inf2.x large 4 16 1 32 32 EBS uniquement S/O Jusqu'à 25 Jusqu'à 10
ml.inf2.8 x large 32 128 1 32 32 EBS uniquement S/O Jusqu'à 25 10
ml.inf 2,24 x large 96 384 6 196 32 EBS uniquement Oui 50 30
ml.inf 2,48 x large 192 768 12 384 32 EBS uniquement Oui 100 60

Amazon SageMaker Studio

Amazon SageMaker Studio est une interface Web unique pour le développement complet de machine learning, offrant un choix d'environnements de développement intégrés (IDE) entièrement gérés et d'outils spécifiques. Vous pouvez accéder à SageMaker Studio gratuitement. Vous êtes uniquement facturé pour le calcul et le stockage sous-jacents que vous utilisez pour différents IDE et outils de machine learning au sein de SageMaker Studio.

Vous pouvez utiliser de nombreux services de SageMaker Studio, AWS SDK pour Python (Boto3) ou de l’interface de la ligne de commande AWS (AWS CLI), notamment les suivants :

  • Des IDE sur SageMaker Studio pour réaliser un développement ML complet avec un large éventail d’IDE entièrement gérés, notamment JupyterLab, un éditeur de code basé sur Code-OSS (Visual Studio Code – Open Source) et RStudio
  • SageMaker Pipelines pour l’automatisation et la gestion des flux ML
  • SageMaker Autopilot pour créer automatiquement des modèles de ML avec une visibilité totale
  • SageMaker Experiments pour organiser et suivre vos offres et versions de la formation
  • SageMaker Debugger pour déboguer les anomalies en cours d'entraînement
  • SageMaker Model Monitor pour maintenir des modèles de qualité supérieure
  • SageMaker Clarify pour mieux expliquer vos modèles ML et détecter les biais
  • SageMaker JumpStart pour déployer facilement des solutions ML pour de nombreux cas d'utilisation. Des frais peuvent vous être facturés à partir des autres services AWS utilisés dans la solution pour les appels d'API sous-jacents effectués par Amazon SageMaker en votre nom.
  • SageMaker Inference Recommender pour obtenir des recommandations sur la configuration idéale du point de terminaison

Vous ne payez que les ressources de calcul et de stockage sous-jacentes dans SageMaker ou d'autres services AWS, en fonction de votre utilisation.

Évaluations du modèle de fondation

SageMaker Clarify prend en charge les évaluations des modèles de fondation à l'aide de méthodes d'évaluation automatiques et fondées sur l'être humain. Chacun d'entre eux a une tarification différente. Si vous évaluez un modèle de fondation d'Amazon SageMaker JumpStart qui n'est pas encore déployé sur votre compte, SageMaker déploiera temporairement le modèle JumpStart sur une instance de SageMaker pendant la durée de l'inférence. L'instance spécifique sera conforme à la recommandation d'instance fournie par JumpStart pour ce modèle.

Évaluation automatique :
Les évaluations des modèles de fondation s'exécutent en tant que tâche de traitement SageMaker. La tâche d'évaluation fera appel à SageMaker Inference. Les clients sont facturés pour l'inférence et pour le travail d'évaluation. Les clients ne sont facturés que pour la durée du travail d'évaluation. Le coût de la tâche d'évaluation serait la somme du coût par heure de l'instance d'évaluation et de la somme du coût par heure de l'instance d'hébergement.

Évaluations fondées sur l'être humain :
Lorsque vous utilisez la fonction d'évaluation fondée sur l'être humain qui vous permet d'amener votre propre personnel, trois éléments vous sont facturés : 1) l'instance SageMaker utilisée pour l'inférence, 2) l'instance utilisée pour exécuter la tâche de traitement SageMaker qui héberge l'évaluation fondée sur l’être humain, et 3) des frais de 0,21 USD par tâche d'évaluation humaine terminée. Une tâche humaine est définie comme l'occurrence par laquelle un travailleur humain soumet une évaluation d'un seul prompt et de ses réponses d'inférence associées dans l'interface utilisateur d'évaluation humaine. Le prix est le même, que vous ayez 1 ou 2 modèles dans votre travail d'évaluation ou que vous apportiez votre propre inférence, et quel que soit le nombre de dimensions d'évaluation et de méthodes de notation que vous incluez. Le prix de 0,21 USD par tâche est le même pour toutes les régions AWS. Il n'y a pas de frais distincts pour la main-d'œuvre, car la main-d'œuvre est fournie par vous.

Évaluation gérée par AWS :
Pour une évaluation par un expert gérée par AWS, la tarification est personnalisée en fonction de vos besoins d'évaluation dans le cadre d'un engagement privé en collaboration avec l'équipe d'évaluation d'AWS.

Amazon SageMaker Studio Lab

Vous pouvez créer et entraîner gratuitement des modèles de ML à l'aide d'Amazon SageMaker Studio Lab. SageMaker Studio Lab met gratuitement à la disposition des développeurs, des universitaires et des scientifiques des données, un environnement de développement sans configuration pour apprendre et expérimenter le ML.

Amazon SageMaker Canvas

Amazon SageMaker Canvas étend l'accès ML en offrant aux analystes métier la possibilité de faire des prédictions ML précises à l'aide d'une interface visuelle par pointer-cliquer, sans exiger la moindre expérience en ML ou en codage.

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling propose deux offres en matière d'étiquetage des données : Amazon SageMaker Ground Truth Plus et Amazon SageMaker Ground Truth. En savoir plus sur Amazon SageMaker Data Labeling, un service d'étiquetage des données entièrement géré qui facilite la création de jeux de données d'entraînement hautement précis pour le ML.

Shadow testing d'Amazon SageMaker

SageMaker vous aide à exécuter des shadow tests pour évaluer un nouveau modèle ML avant la mise en production en testant ses performances par rapport au modèle actuellement déployé. Il n'y a pas de frais supplémentaires pour les tests de SageMaker shadow, à l'exception des frais d'utilisation des instances ML et du stockage ML provisionnés pour héberger le modèle shadow. La tarification des instances ML et des dimensions de stockage ML est la même que celle de l'option d'inférence en temps réel spécifiée dans le tableau de tarification précédent. Il n'y a pas de frais supplémentaires pour les données traitées dans et hors des déploiements shadow.

Amazon SageMaker Edge

En savoir plus sur la tarification d'Amazon SageMaker Edge pour optimiser, exécuter et surveiller les modèles ML sur des flottes d'appareils périphériques. 

Savings Plans Amazon SageMaker

Amazon SageMaker Savings Plans vous offre jusqu'à 64 % de réduction sur les coûts. Les plans s'appliquent automatiquement à l'utilisation des instances ML SageMaker éligibles, y compris les blocs-notes SageMaker Studio, les instances de blocs-notes SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference et SageMaker Batch Transform, indépendamment de la famille, de la taille ou de la région de l'instance. Par exemple, vous pouvez à tout moment passer d'une instance de processeur ml.c5.xlarge s'exécutant dans la région USA Est (Ohio) à une instance ml.Inf1 s'exécutant dans la région USA Ouest (Oregon) pour des charges de travail d'inférence, et toujours bénéficier automatiquement de la tarification Savings Plans. 

En savoir plus »

Coût total de possession (TCO) avec Amazon SageMaker

Par rapport à d'autres solutions autogérées basées sur le cloud, Amazon SageMaker permet de réduire d'au moins 54 % le coût total de possession (TCO) sur trois ans. En savoir plus sur l'analyse complète du TCO sur Amazon SageMaker.

Exemples de tarification

  • En tant que spécialiste des données, vous passez 20 jours à utiliser JupyterLab pour expérimenter rapidement sur des blocs-notes, du code et des données pendant 6 heures par jour sur une instance ml.g4dn.xlarge. Vous créez puis exécutez un espace JupyterLab pour accéder à l'IDE JupyterLab. Le calcul n’est facturé que pour l’instance utilisée lorsque l’espace JupyterLab est en cours d’exécution. Les frais de stockage d’un espace JupyterLab s’accumulent jusqu’à sa suppression.

    Calcul

    Instance Durée Jours Durée totale Prix par heure Total
    ml.g4dn.xlarge 6 heures 20 6 * 20 = 120 heures 0,7364 USD 88,368 USD

    Stockage

    Vous utiliserez un stockage SSD à usage général pendant 480 heures (24 heures * 20 jours). Dans une région qui facture 0,1125 USD par Go/mois :
    0,112 USD par Go/mois x 5 Go x 480 (24 heures/jour x mois de 30 jours) = 0,373 USD

  • En tant qu'ingénieur ML, vous passez 20 jours à utiliser Code Editor pour l'édition, l'exécution et le débogage du code de production ML pendant 6 heures par jour sur une instance ml.g4dn.xlarge. Vous créez puis exécutez un espace d'éditeur de code pour accéder à l'IDE de l'éditeur de code. Le calcul n’est facturé que pour l’instance utilisée lorsque l’espace de l’éditeur de code est en cours d’exécution. Les frais de stockage pour un espace d’éditeur de code s’accumulent jusqu’à sa suppression.

    Calcul

    Instance Durée Jours Durée totale Prix par heure Total
    ml.g4dn.xlarge 6 heures 20 6 * 20 = 120 heures 0,7364 USD 88,368 USD

    Stockage

    Vous utiliserez un stockage SSD à usage général pendant 480 heures (24 heures * 20 jours). Dans une région qui facture 0,1125 USD par Go/mois :
    0,112 USD par Go/mois x 5 Go x 480 (24 heures/jour x mois de 30 jours) = 0,373 USD

  • Un spécialiste des données suit la séquence d'actions suivante lorsqu'il utilise des blocs-notes dans Amazon SageMaker Studio Classic.

    1. Ouvre le bloc-notes 1 dans un noyau TensorFlow sur une instance ml.c5.xlarge et travaille ensuite sur ce bloc-notes pendant 1 heure.
    2. Ouvre le bloc-notes 2 sur une instance ml.c5.xlarge. Il s'ouvrira automatiquement dans la même instance ml.c5.xlarge que celle qui exécute le bloc-notes 1. 
    3. Il travaille simultanément sur le bloc-notes 1 et le bloc-notes 2 pendant 1 heure.
    4. Le spécialiste des données sera facturé pour un total de deux (2) heures d'utilisation de ml.c5.xlarge. Pour l'heure de chevauchement où elle a travaillé simultanément sur le bloc-notes 1 et le bloc-notes 2, chaque application de noyau sera mesurée pendant 0,5 heure et elle sera facturée pour 1 heure.
    Application de noyau Instance de bloc-notes Heures Prix par heure Total
    TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD
    TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Science des données ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Un spécialiste des données passe par la séquence d'actions suivante lorsqu'il utilise RStudio :

    1. Lance RSession 1 sur une instance ml.c5.xlarge, puis travaille sur ce bloc-notes pendant 1 heure.
    2. Lance RSession 2 sur une instance ml.c5.xlarge. Il s'ouvrira automatiquement dans la même instance ml.c5.xlarge que celle qui exécute RSession 1.
    3. Travaille sur la RSesssion 1 et la RSession 2 simultanément pendant 1 heure.
    4. Le scientifique des données sera facturé pour un total de deux (2) heures d'utilisation de ml.c5.xlarge. Pour l'heure de chevauchement où elle a travaillé simultanément sur RSession 1 et RSession 2, chaque application RSession sera mesurée pendant 0,5 heure et elle sera facturée pour 1 heure.

    Pendant ce temps, le RServer fonctionne 24 heures sur 24 et 7 jours sur 7, qu'il y ait des RSessions en cours ou non. Si l'administrateur choisit « Small » (ml.t3.medium), alors il est gratuit. En revanche, s'il choisit « Medium » (ml.c5.4xlarge) ou « Large » (ml.c5.9xlarge), il est facturé à l'heure dans la mesure où RStudio est activé pour le domaine SageMaker.

    Application RSession Instance RSession Heures Prix par heure Total
    Base R ml.c5.xlarge 1 0,204 USD 0,204 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Amazon SageMaker Processing ne facture que les instances utilisées pendant l'exécution de vos tâches. Lorsque vous fournissez les données d'entrées à traiter dans Simple Storage Service (Amazon S3), Amazon SageMaker télécharge les données à partir de Simple Storage Service (Amazon S3) sur un stockage de fichiers local au démarrage d'une tâche de traitement.

    L'analyste de données exécute une tâche de traitement pour prétraiter et valider les données sur deux instances ml.m5.4xlarge pour une durée de 10 minutes. Elle charge un ensemble de données de 100 Go dans S3 comme entrée pour la tâche de traitement, et les données générées (avec à peu près la même taille) sont à nouveau stockées dans S3.

    Heures  Instances de traitement Prix par heure Total
    1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD
    Stockage (Go) polyvalent (SSD) Prix par heure Total
    100 Go * 2 = 200 0,14 USD 0,0032 USD

    Le sous-total de la tâche de traitement Amazon SageMaker = 0,308 USD.
    Le sous-total du stockage SSD polyvalent de 200 Go = 0,0032 USD.
    Dans cet exemple, le prix total serait de 0,3112 USD.

  • D'après le tableau, vous utilisez Amazon SageMaker Data Wrangler pendant un total de 18 heures sur 3 jours pour préparer vos données. De plus, vous créez une tâche SageMaker Data Wrangler pour préparer des données mises à jour chaque semaine. Chaque tâche dure 40 minutes et s'exécute chaque semaine pendant un mois.

    Total des frais mensuels d'utilisation de Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

    Application Instance SageMaker Studio Jours Durée Durée totale Prix par heure Sous-total du prix
    SageMaker Data Wrangler ml.m5.4xlarge 6 heures 18 heures 0,922 USD 16,596 USD
    Tâche SageMaker Data Wrangler ml.m5.4xlarge - 40 minutes 2,67 heures 0,922 USD 2,461 USD

    En tant que spécialiste des données, vous utilisez Amazon SageMaker Data Wrangler pendant trois jours pour nettoyer, explorer et visualiser vos données pendant 6 heures par jour. Pour exécuter votre pipeline de préparation des données, vous lancez ensuite une tâche SageMaker Data Wrangler programmée pour s'exécuter chaque semaine.

    Le tableau ci-dessous résume votre utilisation totale pour le mois et les frais associés à l'utilisation d'Amazon SageMaker Data Wrangler.

  • ++ Toutes les unités de lecture fractionnaires sont arrondies au nombre entier suivant

    Stockage de données
    Total de données stockées = 31,5 Go
    Frais mensuels pour le stockage des données = 31,5 Go x 0,45 USD = 14,175 USD

    Total des frais mensuels Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

    Jour du mois Écritures totales Unités d'écriture totales Lectures totales Unités de lecture totales
    Jours 1 à 10 100.000 écritures 
    (10.000 écritures x 10 jours)
    2.500.000 
    (100,000 x 25 Ko)
    100.000 
    (10.000 x 10 jours)
    700.000++ 
    (100 000 x 25/4 Ko )
             
    Jour 11 200 000 écritures 5.000.000 
    (200.000 x 25 Ko)
    200.000 lectures 1.400.000++ 
    (200.000 x 25/4Ko)
             
    Jours 12 à 30 1 520 000 écritures 
    (80.000 x 19 jours)
    38.000.000 
    (1 520 000 x 25 Ko)
    1 520 000 écritures
    (80 000 x 19 jours)
    10 640 000++
    (1 520 000 x 25/4 Ko)
             
    Unités chargeables totales   45.500.000 unités d’écriture   12.740.000 unités de lecture
    Frais mensuels des écritures et lectures   56,875 USD 
    (45,5 millions unités d’écriture x 1,25 USD par million d’écriture)
      3,185 USD 
    (12,74 millions d'unités de lecture x 0,25 USD par million de lecture)

    Vous disposez d'une application web qui émet des lectures et des écritures de 25 Ko chacune dans Amazon SageMaker Feature Store. Pendant les 10 premiers jours d'un mois, vous recevez peu de notifications vers votre application, à savoir 10 000 écritures et 10 000 lectures par jour dans SageMaker Feature Store. Cependant, le jour 11, votre application attire l'attention sur les réseaux sociaux et son flux atteint 200 000 lectures et 200 000 écritures ce jour-là. Votre application s'installe alors via un flux plus régulier, avec une moyenne de 80 000 lectures et de 80 000 écritures chaque jour jusqu'à la fin du mois.

    Le tableau ci-dessous résume votre utilisation totale mensuelle et les frais associés à l'utilisation de Amazon SageMaker Feature Store.

  • Dans cet exemple, les frais totaux pour l'entraînement et le débogage s'élèvent à 2,38 USD. Les instances de calcul et les volumes de stockage polyvalents utilisés par les règles intégrées d'Amazon SageMaker Debugger n'engendrent pas de frais supplémentaires.

      Stockage polyvalent (SSD) pour l'entraînement (Go) Stockage polyvalent (SSD) pour les règles Debugger intégrées (Go) Stockage polyvalent (SSD) pour les règles Debugger personnalisées (Go) Coût par Go/mois Sous-total
    Capacité utilisée 3 2 1    
    Coût 0 USD Aucun frais supplémentaire pour les volumes de stockage de règle intégrée 0 USD 0,10 USD 0 USD

     

    Heures Instance d'entraînement Instance de débogage Prix par heure Sous-total
    4 x 0,5 = 2,00 ml.m4.4xlarge Non applicable 0,96 USD 1,92 USD
    4 * 0,5 * 2 = 4 Non applicable Aucun frais supplémentaire pour les instances de règle intégrée 0 USD 0 USD
    4 * 0,5 = 2 ml.m5.xlarge Non applicable 0,23 USD 0,46 USD
            -------
            2,38 USD

    Un spécialiste des données a travaillé pendant une semaine sur un modèle afin de donner forme à une nouvelle idée. Elle forme le modèle 4 fois sur une instance ml.m4.4xlarge pendant 30 minutes par exécution de formation avec le Amazon SageMaker Debugger activé en utilisant deux règles intégrées et une règle personnalisée qu'elle a écrite. Pour la règle personnalisée, elle a spécifié une instance ml.m5.xlarge. Elle entraîne le modèle en utilisant 3 Go de données d'entraînement dans Simple Storage Service (Amazon S3) et envoie 1 Go de données générées dans Simple Storage Service (Amazon S3). SageMaker crée des volumes SSD polyvalents (gp2) pour chaque instance d'entraînement. SageMaker crée également des volumes SSD polyvalents (gp2) pour chaque règle spécifiée. Dans cet exemple, un total de quatre volumes SSD polyvalents (gp2) seront créés. SageMaker Debugger émet 1 Go de données de débogage vers le compartiment Simple Storage Service (Amazon S3) du client.

  •   Coût Unités totales Frais mensuels
    Ingestion 1,25 USD par million d'enregistrements métriques 1 million d’enregistrements métriques ingérés (= 1 000 scientifiques de données * 10 fois * 20 epochs * 5 métriques) 1,25 USD (= 1,25 * 1)
    Application SageMaker Studio 0 USD   0 USD
    Frais d'extraction 0,25 USD par million d’enregistrements métriques 10 millions (= 1 million de métriques ingérées x 10 extractions par métrique ingérée) d’enregistrements métriques récupérés 2,5 USD (= 0,25 x 10)
    Stockage 0,25 USD par million d'enregistrements métriques et par mois 1 million d’enregistrements métriques stockés 0,25 USD (= 0,25 * 1)
    Total des frais mensuels     4 USD

    Vous avez un workbench ML utilisé par 1 000 spécialistes des données. Ils mènent des expériences en entraînant leurs modèles avec différents paramètres et jeux de données. Chaque spécialiste des données entraîne un modèle dix fois par mois sur 20 epoch et saisit cinq mesures personnalisées. Le workbench utilise des API d'extraction pour obtenir des données d'expériences de SageMaker Experiments en vue d'une analyse personnalisée. Les scientifiques de données comparent leurs données enregistrées sur dix itérations de formation différentes pour trouver le meilleur modèle candidat. Dans cet exemple, les frais se présentent comme suit :

      Coût Unités totales Frais mensuels
    Ingestion 1,25 USD par million d'enregistrements métriques 100 000 enregistrements métriques ingérés (= 100 scientifiques de données * 10 fois * 20 epochs * 5 métriques) 0,125 USD (= 1,25 * 100 000/1 000 000)
    Application SageMaker Studio 0 USD   0 USD
    Frais d'extraction 0,25 USD par million d'enregistrements métriques 0 0 USD
    Stockage 0,25 USD par million d'enregistrements métriques et par mois 100 000 enregistrements métriques stockés 0,025 USD (= 0,25 * 100 000/1 000 000)
    Total des frais mensuels     0,15 USD

     

    Une équipe de 100 spécialistes des données travaille sur un projet pour une nouvelle idée. Ils mènent des expériences en entraînant leurs modèles avec différents paramètres et jeux de données. En moyenne, chaque scientifique des données entraîne un modèle dix fois par mois sur 20 epoch et saisit cinq mesures personnalisées. Les scientifiques des données utilisent SageMaker Studio pour analyser leurs expériences. Dans cet exemple, les frais se présentent comme suit :

  • Le sous-total pour l'entraînement, l'hébergement et la surveillance s'élève à 305,827 USD. Le sous-total pour 3 100 Mo de données traitées entrantes et 310 Mo de données traitées sortantes pour l'hébergement par mois = 0,054 USD. Dans cet exemple, le coût total s'élèverait à 305,881 USD par mois.

    Remarque : pour les règles intégrées à l'instance ml.m5.xlarge, vous obtenez chaque mois, gratuitement, jusqu'à 30 heures de surveillance regroupées sur tous les points de terminaison.

     

    Données entrantes par mois – Hébergement Données sortantes par mois – Hébergement Prix par Go entrant ou sortant Total
    100 Mo * 31 = 3 100 Mo   0,016 USD 0,0496 USD
      10 Mo * 31 = 310 Mo 0,016 USD 0,00496 USD
    Heures par mois Instances d'hébergement Instances Model Monitor Prix par heure Total
    24 * 31 * 2 = 1 488 ml.c5.xlarge   0,204 USD 303,522 USD
    31 * 0,08 = 2,5   ml.m5.4xlarge 0,922 USD 2,305 USD

    Le modèle de l'exemple #5 est ensuite déployé en production vers deux (2) instances ml.c5.xlarge pour un hébergement Multi-AZ fiable. Amazon SageMaker Model Monitor est activé avec une (1) instance ml.m5.4xlarge et des tâches de surveillance sont programmées une fois par jour. Chaque tâche de surveillance nécessite cinq minutes pour être exécutée. Le modèle reçoit 100 Mo de données par jour, et les inférences représentent 1/10e de la taille des données d'entrée.

  • Le sous-total de l'inférence asynchrone SageMaker s'obtient en faisant le calcul suivant : 15,81 USD + 0,56 USD + 2 * 0,0048 = 16,38 USD. Dans cet exemple, le coût total de l'inférence asynchrone s'élèverait à 16,38 USD par mois.

    Données entrantes par mois Données sortantes par mois Prix par Go entrant ou sortant Total
    10 Ko * 1 024 * 31 = 310 Mo 10 Ko * 1 024 * 31 = 310 Mo 0,02 USD 0,0048
      10 Ko * 1 024 * 31 = 310 Mo 0,02 USD 0,0048
    Stockage (Go) polyvalent (SSD) Coût par Go/mois Total
    4 0,14 USD 0,56 USD
    Heures par mois Instances d'hébergement Prix par heure Total
    2,5 x 31 x 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD

    L'inférence asynchrone Amazon SageMaker vous facture les instances utilisées par votre point de terminaison. Lorsque les instances ne traitent pas activement les requêtes, vous avez la possibilité de configurer la mise à l'échelle automatique pour réduire le nombre d'instances à zéro afin de réduire les coûts. Pour les charges utiles entrantes dans Simple Storage Service (Amazon S3), il n'y a pas de coût pour lire les données entrantes à partir de Simple Storage Service (Amazon S3) et écrire les données sortantes sur S3 dans la même région.

    Le modèle de l'exemple n° 5 est utilisé pour exécuter un point de terminaison d'inférence asynchrone SageMaker. Le point de terminaison est configuré pour fonctionner sur une instance ml.c5.xlarge et réduire le nombre d'instances à zéro lorsqu'il ne traite pas activement des requêtes. L'instance ml.c5.xlarge du point de terminaison a un stockage polyvalent (SSD) de 4 Go qui lui est attaché. Dans cet exemple, le point de terminaison maintient un nombre d'instances de 1 pendant deux heures par jour et dispose d'un temps de stabilisation de 30 minutes, après quoi il réduit à zéro le nombre d'instances pour le reste de la journée. Par conséquent, vous êtes facturé pour 2,5 heures d'utilisation par jour. 

    Le point de terminaison traite 1 024 requêtes par jour. La taille de chaque corps de requête/réponse d'appel est de 10 Ko, et celle de chaque charge utile de requête d'inférence dans Simple Storage Service (Amazon S3) de 100 Mo. Les sorties d'inférence font 1/10e de la taille des données d'entrée qui sont stockées dans Simple Storage Service (Amazon S3) dans la même région. Dans cet exemple, les frais de traitement des données s'appliquent au corps de requête et de réponse, mais pas aux données transférées vers/depuis Simple Storage Service (Amazon S3). 

  • Dans cet exemple, le prix total pour l’inférence serait de 2,88 USD.

    Heures  Instances d'hébergement Prix par heure Total
    3 x 0,25 x 4 = 3 heures ml.m4.4xlarge 0,96 USD 2,88 USD

    Le modèle de l'exemple #5 est utilisé pour exécuter SageMaker Batch Transform. La scientifique des données exécute quatre tâches SageMaker Batch Transform distinctes sur 3 ml.m4.4xlarge à raison de 15 minutes par tâche. Elle charge un jeu de données d'évaluation de 1 Go dans S3 pour chaque cycle, et les inférences représentent 1/10e de la taille des données d'entrée, lesquelles sont stockées dans S3.

  • Frais de traitement de données mensuels

    Traitement de données (Go) Prix par Go entrant ou sortant Frais de traitement de données mensuels
    10 Go 0,016 USD 0,16 USD

    Le sous-total des frais de durée de l’inférence sans serveur SageMaker à la demande est de 40 USD. Le sous-total des frais de traitement de 10 Go de données est de 0,16 USD. Dans cet exemple, le prix total serait de 40,16 USD.

    Frais de calcul mensuels

    Nombre de requêtes Durée de chaque requête Durée d'inférence totale (s) Coût par seconde Frais de durée d'inférence mensuels
    10 millions 100 ms 1 million 0,00004 USD 40 USD

    Avec l'Inférence sans serveur à la demande, vous ne payez que la capacité de calcul utilisée pour traiter les demandes d'inférence, facturées à la milliseconde, et la quantité de données traitées. Les frais de calcul dépendent de la configuration de mémoire choisie.

    Si vous allouez 2 Go de mémoire à votre point de terminaison, que vous l'exécutez 10 millions de fois en un mois pendant 100 minutes à chaque fois et que vous traitez 10 Go de données entrantes/sortantes au total, vos frais seront calculés comme suit :

  • Supposons que vous gérez un service de chatbot pour une société de traitement des salaires. Vous vous attendez à une augmentation du nombre de demandes des clients à la fin du mois de mars, avant la date limite de déclaration fiscale. Toutefois, pour le reste du mois, le trafic devrait être faible. Vous déployez donc un point de terminaison sans serveur doté de 2 Go de mémoire et vous ajoutez une simultanéité provisionnée de 100 pendant les 5 derniers jours du mois, de 9 h à 17 h (8 h), pendant laquelle votre point de terminaison traite 10 millions de demandes et 10 Go d'entrées/sorties de données au total. Le reste du mois, le chatbot fonctionne sur l'inférence sans serveur à la demande et traite 3 millions de requêtes et 3 Go d'entrées/sorties de données. Supposons que la durée de chaque demande soit de 100 ms.

    Frais pour la simultanéité allouée
    Le prix du PC est de 0,000010 USD/sec
    Durée d'utilisation du PC (secondes) = 5 jours* 100 PC* 8 heures* 3600 sec = 14 400 000 secondes
    Frais d'utilisation du PC = 14 400 000 secs* 0,000010 USD/sec = 144 USD.

    Frais de durée d'inférence pour le trafic desservi par la simultanéité allouée
    Le prix de la durée d'inférence est de 0,000023 USD/sec
    Durée totale d'inférence pour PC (sec) = 10 M* (100 ms) /1 000 = 1 million de secondes.
    Frais de durée d'inférence pour PC = 1 000 000 sec * 0,000023/sec = 23 USD

    Frais de durée d'inférence à la demande
    Le prix de calcul mensuel est de 0,00004 USD par seconde et le niveau gratuit fournit 150 000 secondes.
    Calcul total (secondes) = (3) M* (100 ms) /1 000 = 0,3 millions de secondes.
    Taux de calcul total – Taux de calcul offert = Taux de calcul facturable par mois en secondes
    0,3 millions de secondes — 150 000 secondes = 150 000 secondes
    Frais de calcul mensuels = 150 000 *0,00004 USD = 6 USD

    Traitement de données
    Coût/Go de données traitées à l'entrée/sortie = 0,016 USD
    Nombre total de Go traités = 10+3 = 13
    Coût total = 0,016 USD*13 = 0,208 USD

    Total des frais pour mars
    Frais totaux = Frais de concurrence provisionnés+ Durée d'inférence pour la concurrence provisionnée + Durée d'inférence pour le calcul à la demande + Frais de traitement des données
    = 144 USD + 23 USD +6 USD + 0,208 USD = 173,2 USD

  • Le client utilise JumpStart pour déployer un modèle BERT Base Uncased pré-entraîné afin de classer comme positif ou négatif le ressenti issu des commentaires des clients.

    Le client déploie le modèle sur deux (2) instances ml.c5.xlarge pour un hébergement Multi-AZ fiable. Le modèle reçoit 100 Mo de données par jour, et les inférences représentent 1/10e de la taille des données entrantes.

    Heures par mois Instances d'hébergement Prix par heure Total
    24 * 31 * 2 = 1 488 ml.c5.xlarge 0,204 USD 303,55 USD
     
    Données entrantes par mois – Hébergement Données sortantes par mois – Hébergement Prix par Go entrant ou sortant

    Total

    100 Mo * 31 = 3 100 Mo   0,02 USD 0,06 USD
      10 Mo * 31 = 310 Mo 0,02 USD 0,01 USD
     

    Le sous-total pour l'entraînement, l'hébergement et la surveillance s'élève à 305,827 USD. Le sous-total pour 3 100 Mo de données traitées entrantes et 310 Mo de données traitées sortantes pour l'hébergement par mois = 0,06 USD. Dans cet exemple, le coût total s'élèverait à 305,887 USD.

  • Supposons que vous souhaitiez un cluster de 64 p5 pour 3 mois d'utilisation continue afin de prendre en charge le déploiement de modèles de bout en bout.

    Heures Instance d'entraînement Prix par heure
    3 mois * 30 jours * 24 heures = 2 160 heures ml.p5.48xlarge 113,07 USD
     

    Dans cet exemple, les frais totaux pour le cluster sont de 244 321 20 USD

  • Les évaluations des modèles de fondation avec SageMaker Clarify ne vous facturent que les instances utilisées pendant l'exécution de vos tâches d'évaluation automatique. Lorsque vous sélectionnez une tâche d'évaluation automatique et un jeu de données, SageMaker charge le jeu de données rapide depuis Amazon S3 sur une instance d'évaluations SageMaker.

    Dans l'exemple suivant, un ingénieur ML effectue une évaluation du modèle Llama2 7B dans les USA Est (Virginie du Nord) pour vérifier la précision des tâches de synthèse. Le type d'instance recommandé pour l'inférence pour Llama 2 7B est ml.g5.2xlarge. L'instance minimale recommandée pour une évaluation est ml.m5.2xlarge. Dans cet exemple, la tâche s'exécute pendant 45 minutes (en fonction de la taille du jeu de données). Dans cet exemple, le coût serait de 1,48 USD pour le travail d'évaluation et les résultats détaillés.

    Traitement des heures de travail (exemple)

    Région

    Type d’instance

    Instance

    Prix par heure

    Coût

    0,45

    US-east-1

    Hébergement LLM

    ml.g5.2xlarge

    1.52 USD

    1,14 USD

    0,45

    US-east-1

    évaluation

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Total

           

    1,48 USD

    Dans l'exemple suivant, le même ingénieur en Virginie exécute une autre tâche d'évaluation pour la précision des tâches de synthèse, mais utilise une version personnalisée de Llama 2 7B qui est déployée sur son compte et est opérationnelle. Dans ce cas, étant donné que le modèle est déjà déployé sur leur compte, le seul coût supplémentaire serait lié à l'instance d'évaluation.

    Traitement des heures de travail

    Région

    Type d’instance

    Instance

    Prix par heure

    Coût

    0,45

    US-east-1

    évaluation

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Total

           

    0,35 USD

  • Dans l'exemple suivant, un ingénieur en machine learning des USA Est (Virginie du Nord) effectue une évaluation humaine de Llama-2-7B en ce qui concerne la précision des tâches de synthèse et fait appel à sa propre main-d'œuvre privée pour l'évaluation. Le type d'instance recommandé pour Llama-2-7B est ml.g5.2xlarge. L'instance minimale recommandée pour une tâche de traitement d'évaluation fondée sur l'humain est ml.t3.medium. L'inférence sur Llama-2-7B s'exécute pendant 45 minutes (en fonction de la taille du jeu de données). Le jeu de données contient 50 prompts, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble de réponses rapides (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par prompt »). Cette tâche d'évaluation comportera 100 tâches (1 tâche pour chaque paire de réponses rapides pour chaque travailleur : 2 travailleurs x 50 ensembles de réponses rapides = 100 tâches humaines). La main-d'œuvre humaine met une journée (24 heures) à effectuer les 100 tâches d'évaluation humaine du poste d'évaluation (cela dépend du nombre et du niveau de compétence des travailleurs, ainsi que de la longueur/de la complexité des prompts et des réponses d'inférence).

    Heures de calcul

    Tâches humaines

    Région

    Type d’instance

    Instance

    Prix par heure

    Coût par tâche humaine

    Coût total

    0,45

     

    USA Est (Virginie du Nord)

    Hébergement LLM

    ml.g5.2xlarge

    1.52 USD

     

    1,14 USD

    24

     

    USA Est (Virginie du Nord)

    Tâche de traitement

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    N'importe lequel

         

    0,21 USD

    21,00 USD

    Total

               

    23,34 USD

    Dans l'exemple suivant, le même ingénieur des USA Est (Virginie du Nord) exécute la même tâche d'évaluation mais utilise Llama-2-7B déjà déployé sur son compte et opérationnel. Dans ce cas, le seul coût supplémentaire serait lié à la tâche de traitement de l'évaluation et aux tâches humaines.

    Heures de calcul

    Tâches humaines

    Région

    Type d’instance

    Instance

    Prix par heure

    Coût par tâche humaine

    Coût total

    24

     

    USA Est (Virginie du Nord)

    Tâche de traitement

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    N'importe lequel

         

    0,21 USD

    21,00 USD

    Total

               

    22,20 USD