Avec AWS Glue, vous payez un taux horaire facturé à la seconde pour les crawler (la recherche de données) et les tâches d’exactitude, de transformation et chargement d'ETL (le traitement et le chargement de données). Pour le catalogue de données AWS Glue, vous payez des frais mensuels simplifiés pour stocker et accéder aux métadonnées. Le premier million d'objets stockés est gratuit, ainsi que le premier million d'accès. Si vous mettez en service un point de terminaison de développement pour développer votre code ETL de façon interactive, vous payez un taux horaire facturé à la seconde. Pour AWS Glue DataBrew, les séances interactives sont facturées par séance et les tâches DataBrew sont facturées par minute. L'utilisation d'AWS Glue Schema Registry est proposée sans frais supplémentaires.
Remarque : la tarification peut varier en fonction de la région.
-
Tâches ETL et séances interactives
-
Stockage et requêtes pour le catalogue de données
-
Robots d'analyse
-
Séances interactives DataBrew
-
Tâches DataBrew
-
Qualité des données
-
Tâches ETL et séances interactives
-
Exemples de tarification
Tâche ETL : imaginez une tâche AWS Glue Apache Spark qui s’exécute pendant 15 minutes et utilise 6 DPU. Le prix d'une DPU par heure est de 0,44 USD. Comme votre tâche a duré 1/4 d’heure et utilisé 6 DPU, AWS vous facturera 6 DPU * 1/4 d’heure * 0,44 USD, soit 0,66 USD.
Blocs-notes de tâches et sessions interactives AWS Glue Studio : imaginons que vous utilisiez un bloc-note dans AWS Glue Studio pour développer votre code ETL de manière interactive. Une session interactive a 5 DPU par défaut. Si la session tourne pendant 24 minutes, soit 2/5 d'une heure, il vous sera facturé un montant de 5 DPU * 2/5 d'une heure à un taux de 0,44 USD par DPU par heure, soit 0,88 USD.
ML Transforms : tout comme l'exécution de tâches AWS Glue, le coût d'exécution de ML Transforms, y compris de FindMatches sur vos données, varie en fonction de la taille de vos données, de leur contenu et du nombre, ainsi que du type, de nœuds que vous utilisez. Dans l'exemple suivant, nous avons utilisé FindMatches pour intégrer des informations sur des points d'intérêt de plusieurs sources de données. Avec une taille d'ensemble de données d'environ 11 000 000 de lignes (1,6 Go), une taille de donnée d'étiquette (exemples de correspondances ou de non-correspondances vraies) d'environ 8 000 lignes (641 Ko), s'exécutant sur 16 instances de type G.2x, vous auriez un délai d'exécution de génération d'ensemble d'étiquettes de 34 minutes au prix de 8,23 USD, un délai d'exécution d'estimation des métriques de 11 minutes au prix de 2,66 USD et un délai d'exécution de tâche FindingMatches de 32 minutes au prix de 7,75 USD.
-
Stockage et requêtes pour le catalogue de données
-
Exemples de tarification
Offre gratuite pour le catalogue de données AWS Glue : imaginons que vous stockiez un million de tables dans votre catalogue de données AWS Glue pour un mois donné et que vous fassiez un million de requêtes d'accès à ces tables. Vous devez payer 0 USD, car votre utilisation rentre dans l'offre gratuite du catalogue de données AWS Glue. Le premier million d'objets stockés et le premier million de requêtes passées sont gratuits.
Catalogue de données AWS Glue : imaginons maintenant que votre utilisation du stockage reste la même, un million de tables par mois, mais que le nombre de vos requêtes double pour atteindre deux millions de requêtes par mois. De plus, imaginons également que vous utilisez des robots d'analyse pour trouver de nouvelles tables et qu'ils fonctionnent pendant 30 minutes en consommant 2 DPU.
Vos frais de stockage restent à 0 USD, étant donné que le stockage du premier million de tables est gratuit. Votre premier million de requêtes est également gratuit. Vous serez facturé pour le premier million de requêtes au-delà de l'offre gratuite, ce qui équivaut à 1 USD. Les robots d'analyse sont facturés au taux de 0,44 USD par DPU par heure, vous devrez donc payer pour 2 DPU * 1/2 heure à un taux de 0,44 USD par DPU par heure, soit 0,44 USD. Soit une facture mensuelle totale de 1,44 USD.
-
Robots d'analyse
-
-
Séances interactives DataBrew
-
Exemples de tarification
AWS Glue DataBrew : Le prix pour chaque séance interactive de 30 minutes s'élève à 1,00 USD. Si vous démarrez une séance à 9 h 00, et si vous quittez immédiatement la console et n'y revenez qu'entre 9 h 20 et 9 h 30, vous serez facturé pour 1 séance, pour un total de 1 USD.
Si vous démarrez un séance à 9 h 00 et que vous interagissez avec la console DataBrew jusqu'à 9 h 50, quittez l'espace de projet DataBrew et revenez-y pour la dernière interaction à 10 h 15. Ainsi, vous serez facturé pour 3 séances et donc un total de 3 USD, à raison de 1 USD par séance.
-
Tâches DataBrew
-
Exemples de tarification
AWS Glue DataBrew : Si une tâche AWS Glue DataBrew s'exécute pendant 10 minutes et consomme 5 nœuds AWS Glue DataBrew, le prix s'élève à 0,40 USD. Votre tâche ayant été exécutée pendant 1/6 d'heure (10 min) et ayant consommé 5 nœuds, votre facturation est de 5 nœuds x 1/6 heure/nœud x 0,48 USD/nœud-heure = 0,40 USD.
-
Qualité des données
-
Exemples de tarification
Exemple 1 – Obtenir des recommandations pour une table dans le catalogue de données AWS Glue
Par exemple, considérons une tâche de recommandation avec 5 DPU qui se termine en 10 minutes. Vous paierez 5 DPUs * 1/6 heure * 0,44 USD, soit 0,37 USD.
Exemple 2 – Évaluer la qualité des données dans une table dans le Catalogue de données AWS Glue
Après avoir examiné les recommandations, vous pouvez les modifier si nécessaire, puis planifier la tâche de qualité des données en approvisionnant les DPU. Par exemple, considérons une tâche de l’évaluation de la qualité des données avec 5 DPU qui se termine en 20 minutes.
Vous paierez 5 DPU * 1/3 heure * 0,44 USD, soit 0,73 USD.
Exemple 3 – Évaluer la qualité des données dans une tâche AWS Glue ETL
Vous pouvez également ajouter ces contrôles de qualité des données à vos tâches ETL AWS Glue afin d'empêcher les mauvaises données d'entrer dans vos lacs de données. Vous pouvez le faire en ajoutant Data Quality Transform sur AWS Glue Studio ou en utilisant les API AWS Glue dans le code que vous rédigez dans les blocs-notes AWS Glue Studio. Prenons l'exemple d'une tâche AWS Glue qui s'exécute là où les règles de qualité des données sont configurées dans le pipeline, et qui s'exécute pendant 20 minutes (1/3 d'heure) avec 6 DPU. Vous serez facturé 6 DPU * 1/3 heure * 0,44 USD, soit 0,88 USD. Vous pouvez également utiliser le Flex, pour lequel vous serez facturé 6 DPU * 1/3 heure * 0,29 USD, soit 0,58 USD.
Remarque : la tarification peut varier en fonction de la région.
Consultez le tableau des régions mondiales pour en savoir plus sur la disponibilité d'AWS Glue.
Ressources de tarification supplémentaires
Calculer facilement vos coûts mensuels avec AWS
Contacter les spécialistes AWS pour obtenir un devis personnalisé

Commencez à créer avec AWS Glue dans AWS Management Console.