Avec AWS Glue, vous payez un taux horaire facturé à la seconde pour les crawlers (la recherche de données) et les tâches d’exactitude, de transformation et chargement d'ETL (le traitement et le chargement de données). Pour le catalogue de données AWS Glue, vous payez des frais mensuels simplifiés pour stocker et accéder aux métadonnées. Le premier million d'objets stockés est gratuit, ainsi que le premier million d'accès. Si vous mettez en service un point de terminaison de développement pour développer votre code ETL de façon interactive, vous payez un taux horaire facturé à la seconde. Pour AWS Glue DataBrew, les séances interactives sont facturées par séance et les tâches DataBrew sont facturées par minute. L'utilisation d'AWS Glue Schema Registry est proposée sans frais supplémentaires.

Remarque : la tarification peut varier en fonction de la région AWS.

  • Tâches ETL et séances interactives
  • Exemples de tarification

    Tâche ETL : imaginez une tâche AWS Glue Apache Spark qui s’exécute pendant 15 minutes et utilise 6 DPU. Le prix d'une DPU par heure est de 0,44 USD. Comme votre tâche a duré 1/4 d’heure et utilisé 6 DPU, AWS vous facturera 6 DPU * 1/4 d’heure * 0,44 USD, soit 0,66 USD.

    Blocs-notes de tâches et sessions interactives AWS Glue Studio : imaginons que vous utilisiez un bloc-note dans AWS Glue Studio pour développer votre code ETL de manière interactive. Une session interactive a 5 DPU par défaut. Si la session tourne pendant 24 minutes, soit 2/5 d'une heure, il vous sera facturé un montant de 5 DPU * 2/5 d'une heure à un taux de 0,44 USD par DPU par heure, soit 0,88 USD.

    ML Transforms : tout comme l'exécution de tâches AWS Glue, le coût d'exécution de ML Transforms, y compris de FindMatches sur vos données, varie en fonction de la taille de vos données, de leur contenu et du nombre, ainsi que du type, de nœuds que vous utilisez. Dans l'exemple suivant, nous avons utilisé FindMatches pour intégrer des informations sur des points d'intérêt de plusieurs sources de données. Avec une taille de jeux de données d'environ 11 000 000 de lignes (1,6 Go), une taille de donnée d'étiquette (exemples de correspondances ou de non-correspondances vraies) d'environ 8 000 lignes (641 Ko), s'exécutant sur 16 instances de type G.2x, vous auriez un délai d'exécution de génération d'ensemble d'étiquettes de 34 minutes au prix de 8,23 USD, un délai d'exécution d'estimation des métriques de 11 minutes au prix de 2,66 USD et un délai d'exécution de tâche FindingMatches de 32 minutes au prix de 7,75 USD.

  • Catalogue de données
  • Exemples de tarification

    Offre gratuite pour le catalogue de données AWS Glue : imaginons que vous stockiez un million de tables dans votre catalogue de données AWS Glue pour un mois donné et que vous fassiez un million de requêtes d'accès à ces tables. Vous devez payer 0 USD, car votre utilisation rentre dans l'offre gratuite du catalogue de données AWS Glue. Le premier million d'objets stockés et le premier million de requêtes passées sont gratuits.

    Catalogue de données AWS Glue : imaginons maintenant que votre utilisation du stockage reste la même, un million de tables par mois, mais que le nombre de vos requêtes double pour atteindre deux millions de requêtes par mois. De plus, imaginons également que vous utilisez des crawlers pour trouver de nouvelles tables et qu'ils fonctionnent pendant 30 minutes en consommant 2 DPU.

    Vos frais de stockage restent à 0 USD, étant donné que le stockage du premier million de tables est gratuit. Votre premier million de requêtes est également gratuit. Vous serez facturé pour le premier million de requêtes au-delà de l'offre gratuite, ce qui équivaut à 1 USD. Les crawlers sont facturés au taux de 0,44 USD par DPU par heure, vous devrez donc payer pour 2 DPU * 1/2 heure à un taux de 0,44 USD par DPU par heure, soit 0,44 USD.

    Si vous générez des statistiques sur des tables Glue et que l'exécution des statistiques prend 10 minutes et consomme 1 DPU, vous serez facturé 1 DPU* 1/6 heure* 0,44 USD/DPU/heure, soit 0,07 USD.

    Si vous compactez des tables Apache Iceberg et que le compactage dure 30 minutes et consomme 2 DPU, vous serez facturé 2 DPU* 1/2 heure* 0,44 USD/heure, soit 0,44 USD par heure.

  • Crawlers
  • Séances interactives DataBrew
  • Exemples de tarification

    AWS Glue DataBrew : Le prix pour chaque séance interactive de 30 minutes s'élève à 1,00 USD. Si vous démarrez une séance à 9h00, et si vous quittez immédiatement la console et n'y revenez qu'entre 9h20 et 9h30, vous serez facturé pour 1 séance, pour un total de 1,00 USD.

    Si vous démarrez un séance à 9h00 et que vous interagissez avec la console DataBrew jusqu'à 9h50, quittez l'espace de projet DataBrew et revenez-y pour la dernière interaction à 10h15. Ainsi, vous serez facturé pour 3 séances et donc un total de 1,00 USD, à raison de 3,00 USD par séance.

  • Tâches DataBrew
  • Exemples de tarification

    AWS Glue DataBrew : Si une tâche AWS Glue DataBrew s'exécute pendant 10 minutes et consomme 5 nœuds DataBrew, le prix s'élève à 0,40 USD. Votre tâche ayant été exécutée pendant 1/6 d'heure et ayant consommé 5 nœuds, votre facturation est de 5 nœuds x 1/6 heure/nœud x 0,48 USD/nœud-heure = 0,40 USD.

  • Qualité des données
  • Exemples de tarification

     

    Exemple 1 – Obtenir des recommandations pour une table dans le catalogue de données

    Par exemple, considérons une tâche de recommandation avec 5 DPU qui se termine en 10 minutes. Vous paierez 5 DPUs * 1/6 heure * 0,44 USD, soit 0,37 USD. 

    Exemple 2 – Évaluer la qualité des données dans une table dans le Catalogue de données AWS Glue

    Après avoir examiné les recommandations, vous pouvez les modifier si nécessaire, puis planifier la tâche de qualité des données en approvisionnant les DPU. Par exemple, considérons une tâche de l’évaluation de la qualité des données avec 5 DPU qui se termine en 20 minutes.

    Vous paierez 5 DPU * 1/3 heure * 0,44 USD, soit 0,73 USD. 

    Exemple 3 – Évaluer la qualité des données dans une tâche AWS Glue ETL

    Vous pouvez également ajouter ces contrôles de qualité des données à vos tâches ETL AWS Glue afin d'empêcher les mauvaises données d'entrer dans vos lacs de données. Vous pouvez le faire en ajoutant Data Quality Transform sur AWS Glue Studio ou en utilisant les API AWS Glue dans le code que vous rédigez dans les blocs-notes AWS Glue Studio. Prenons l'exemple d'une tâche AWS Glue qui s'exécute là où les règles de qualité des données sont configurées dans le pipeline, et qui s'exécute pendant 20 minutes (1/3 d'heure) avec 6 DPU. Vous serez facturé 6 DPU * 1/3 heure * 0,44 USD, soit 0,88 USD. Vous pouvez également utiliser le Flex, pour lequel vous serez facturé 6 DPU * 1/3 heure * 0,29 USD, soit 0,58 USD.

     

Remarque : la tarification peut varier en fonction de la région.

Consultez le tableau des régions mondiales pour en savoir plus sur la disponibilité d'AWS Glue.

Ressources de tarification supplémentaires

Calculateur de tarification AWS

Calculer facilement vos coûts mensuels avec AWS

Obtenir une assistance pour la tarification

Contacter les spécialistes AWS pour obtenir un devis personnalisé

Mise en route avec AWS Glue
Découvrir comment démarrer avec AWS Glue

Suivez les étapes pour commencer et accédez à des vidéos et à des ressources.

En savoir plus 
Créer un compte AWS
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Commencez à créer dans la console
Commencer à créer dans la console

Commencez à créer avec AWS Glue dans AWS Management Console.

Se connecter