Questions d'ordre général

Q : Qu'est-ce qu'AWS Glue ?

AWS Glue est un service entièrement géré d'extraction, de transformation et de chargement (ETL) des données qui automatise les étapes chronophages de préparation des données en vue de les analyser. Le service AWS Glue découvre et établit le profil de vos données automatiquement par le biais du catalogue de données Glue. Il génère le code ETL permettant de transformer vos données sources en schémas cibles et il exécute la tâche ETL dans un environnement Apache Spark entièrement géré et à dimensionnement progressif pour charger vos données vers leur destination. Il vous permet également d'installer, d'orchestrer et de surveiller les flux de données complexes.

Q : Comment démarrer avec AWS Glue ?

Pour commencer à utiliser AWS Glue, connectez-vous simplement à AWS Management Console et accédez à « Glue » dans la catégorie « Analyse ». Vous pouvez suivre l'un de nos tutoriels qui vous guidera dans un exemple de cas d'utilisation pour AWS Glue. Vous trouverez également des exemples de code ETL dans notre référentiel GitHub sous AWS Labs.

Q : Quels sont les principaux composants d'AWS Glue ?

AWS Glue comprend un catalogue de données qui est un référentiel de métadonnées centrales, un moteur ETL qui peut automatiquement générer du code Scala ou Python, et un planificateur flexible qui traite la résolution des dépendances, la surveillance des tâches et les tentatives en cas d'échec. Ensemble, ces fonctionnalités automatisent une grande partie des lourdes tâches impliquées dans la découverte, la catégorisation, le nettoyage, l'enrichissement et le déplacement des données. Ainsi vous pouvez passer plus de temps à analyser vos données.

Q : Quand faut-il utiliser AWS Glue ?

Utilisez AWS Glue pour découvrir les propriétés des données que vous possédez, les transformer et les préparer pour analyse. Glue peut automatiquement découvrir les données structurées et semi-structurées dans vos lac de données sur Amazon S3, entrepôt de données dans Amazon Redshift et différentes bases de données exécutées sur AWS. Ce service fournit une vue unifiée de vos données via le catalogue de données Glue qui est disponible pour les tâches ETL en interrogeant et établissant des rapports à l'aide de services tels qu'Amazon Athena, Amazon EMR et Amazon Redshift Spectrum. Glue génère automatiquement du code Scala ou Python pour vos tâches ETL et vous pouvez le personnaliser davantage en utilisant les outils que vous connaissez déjà. AWS Glue est sans serveur, il n'y a donc aucune ressource de calcul à configurer ou gérer.

Q : Quelles sont les sources de données prises en charge par AWS Glue ?

AWS Glue prend en charge dès le départ les données stockées dans Amazon Aurora, Amazon RDS pour MySQL, Amazon RDS pour Oracle, Amazon RDS pour PostreSQL, Amazon RDS pour SQL Server, Amazon Redshift et Amazon S3, ainsi que dans les bases de données MySQL, Oracle, Microsoft SQL Server et PostgreSQL dans votre Virtual Private Cloud (Amazon VPC) s'exécutant sur Amazon EC2. Les métadonnées stockées dans le catalogue de données AWS Glue sont facilement accessibles à partir d'Amazon Athena, Amazon EMR et Amazon Redshift Spectrum. Vous pouvez également écrire du code Scala ou Python et importer des bibliothèques personnalisées et des fichiers Jar dans vos tâches ETL Glue pour accéder aux sources de données qui ne sont pas prises en charge de manière native par AWS Glue. Pour en savoir plus sur l'importation de bibliothèques personnalisées, consultez notre documentation.

Q : Comment AWS Glue est-il associé à AWS Lake Formation ?

R : Lake Formation met à profit une infrastructure partagée avec AWS Glue, et notamment des commandes de console, la création de code ETL et la surveillance de tâche, un catalogue de données commun et une architecture sans serveur. Alors qu’AWS Glue reste concentré sur ces types de fonctions, Lake Formation englobe toutes les fonctions AWS Glue ET fournit des fonctionnalités supplémentaires pour aider à développer, sécuriser et gérer un lac de données. Pour plus de détails, consultez les pages AWS Lake Formation.

Catalogue de données AWS Glue

Q : Qu'est-ce que le catalogue de données AWS Glue ?

Le catalogue de données AWS Glue est un référentiel central pour stocker les métadonnées structurelles et opérationnelles de toutes vos données. Pour un ensemble de données particuliers, vous pouvez stocker la définition de sa table et son emplacement physique, ajouter les attributs pertinents de l'entreprise et suivre les modifications apportées aux données dans le temps.

Le catalogue de données AWS Glue est compatible avec le metastore Apache Hive et sert de remplacement instantané au metastore Apache Hive pour les applications Big Data exécutées sur Amazon EMR. Pour en savoir plus sur l'installation de votre cluster EMR afin d'utiliser le catalogue de données AWS Glue comme metastore Apache Hive, cliquez ici.

Le catalogue de données AWS Glue s'intègre également à Amazon Athena, Amazon EMR et Amazon Redshift Spectrum. Lorsque vous ajoutez vos définitions de table au catalogue de données Glue, elles deviennent disponibles pour les tâches ETL et sont également facilement interrogeables dans Amazon Athena, Amazon EMR et Amazon Redshift Spectrum. Vous obtenez ainsi une vue commune de vos données entre ces services.

Q : Comment intégrer mes métadonnées au catalogue de données AWS Glue ?

AWS Glue propose plusieurs méthodes pour alimenter les métadonnées dans le catalogue de données AWS Glue. Les robots d'analyse de Glue peuvent analyser les différents magasins de données que vous possédez pour en déduire automatiquement des schémas et une structure de partition, et alimenter le catalogue de données Glue avec les définitions de table et les statistiques correspondantes. Vous pouvez également planifier l'exécution régulière de robots d'analyse pour que vos métadonnées soient toujours à jour et synchronisées avec les données sous-jacentes. Vous avez aussi la possibilité d'ajouter et de mettre à jour les détails de la table manuellement en utilisant AWS Glue Console ou par un appel d'API. Vous pouvez exécuter les instructions DDL Hive via la console Amazon Athena ou un client Hive sur un cluster Amazon EMR. Enfin, si vous possédez déjà un metastore Apache Hive persistant, vous pouvez effectuer une importation globale de ces métadonnées dans le catalogue de données AWS Glue en utilisant notre script d'importation.

Q : Que sont les robots d'analyse AWS Glue ?

Un robot AWS Glue se connecte à une banque de données, progresse à travers une liste classée par priorité de classificateurs pour extraire le schéma de vos données et d'autres statistiques, puis alimente le catalogue de données Glue avec ces métadonnées. Les robots peuvent être exécutés régulièrement pour détecter la présence de nouvelles données ainsi que des changements aux données existantes, y compris les changements apportés à la définition à la table. Les robots ajoutent automatiquement de nouvelles tables, de nouvelles partitions aux tables existantes et de nouvelles versions des définitions des tables. Vous pouvez personnaliser les robots Glue pour classer vos propres types de fichiers.

Q : Comment puis-je importer des données de mon metastore Apache Hive existant vers le catalogue de données AWS Glue ?

Exécutez simplement une tâche ETL qui lit votre metastore Apache Hive, exporte les données dans un format intermédiaire vers Amazon S3, puis les importe dans le catalogue de données AWS Glue.

Q : Faut-il que je maintienne mon metastore Apache Hive si je stocke mes métadonnées dans le catalogue de données AWS Glue ?

Non. Le catalogue de données AWS Glue est compatible avec le metastore Apache Hive. Vous pouvez pointer vers le point de terminaison du catalogue de données Glue et l'utiliser à la place du metastore Apache Hive. Pour en savoir plus sur la manière de configurer votre cluster afin d'utiliser votre catalogue de données AWS Glue en tant que metastore Apache Hive, consultez notre documentation ici.

Q : Si j'utilise déjà Amazon Athena ou Amazon Redshift Spectrum et que j'ai des tables dans le catalogue de données internes d'Amazon Athena, comment puis-je commencer à utiliser le catalogue de données AWS Glue comme référentiel de métadonnées commun ?

Avant de pouvoir commencer à utiliser le catalogue de données AWS Glue comme référentiel de métadonnées commun entre Amazon Athena, Amazon Redshift Spectrum et AWS Glue, vous devez faire passer le catalogue de données Amazon Athena à la version du catalogue de données AWS Glue. Les étapes requises pour cette opération sont détaillées ici.

Extraction, transformation et chargement (ETL) des données

Q : Quel langage de programmation puis-je utiliser pour écrire on code ETL pour AWS Glue ?

Vous pouvez utiliser Scala ou Python.

Q : Comment puis-je personnaliser le code ETL généré par AWS Glue ?

Le système de recommandation de script ETL du service AWS Glue génère un code Scala ou Python. Il se sert de la bibliothèque ETL personnalisée de Glue pour simplifier l'accès aux sources de données et gérer l'exécution des tâches. Pour en savoir plus sur la bibliothèque, consultez notre documentation. Vous pouvez écrire du code ETL en utilisant la bibliothèque personnalisée de Glue ou du code arbitraire en Scala ou Python en modifiant le code en ligne via l'éditeur de scripts AWS Glue Console, en téléchargeant le code auto-généré et en le modifiant dans votre propre environnement de développement intégré. Vous pouvez également commencer avec l'un des nombreux exemples qui se trouvent dans notre référentiel Github et personnaliser ce code.

Q : Puis-je importer des bibliothèques personnalisées dans le cadre de mon script ETL ?

Oui. Vous pouvez importer des bibliothèques Python et des fichiers Jar dans votre tâche ETL AWS Glue. Pour en savoir plus, consultez notre documentation ici.

Q : Puis-je apporter mon propre code ?

Oui. Vous pouvez écrire votre propre code à l'aide de la bibliothèque ETL d'AWS Glue, ou écrire votre propre code Scala ou Python, puis le télécharger vers une tâche ETL Glue. Pour en savoir plus, consultez notre documentation ici.

Q : Comment puis-je développer mon code ETL en utilisant mon propre environnement de développement intégré (IDE) ?

Vous pouvez créer et vous connecter à des points de terminaison de développement qui offrent le moyen de connecter vos notebooks et environnement IDE.

Q : Comment puis-je développer des charges de travail ETL de bout en bout en utilisant plusieurs tâches dans AWS Glue ?

Outre la bibliothèque ETL et la génération de codes, AWS Glue fournit un ensemble robuste de fonctionnalités d'orchestration qui vous permettent de gérer les dépendances entre plusieurs tâches afin de développer des workflow ETL de bout en bout. Les tâches ETL AWS Glue peuvent être déclenchées selon un calendrier ou lorsqu'un événement se termine. Plusieurs tâches peuvent être déclenchées parallèlement ou séquentiellement lors d'un événement de fin de tâche. Vous pouvez également déclencher une ou plusieurs tâches Glue à partir d'une source externe telle qu'une fonction AWS Lambda.

Q : Comment AWS Glue surveille les dépendances ?

AWS Glue gère les dépendances entre deux ou plusieurs tâches ou les dépendances sur les événements externes en utilisant des déclencheurs. Les déclencheurs peuvent surveiller et invoquer une ou plusieurs tâches. Vous pouvez avoir un déclencheur planifié qui invoque les tâches régulièrement, un déclencheur à la demande, ou un déclencheur en fonction de la fin d'un événement.

Q : Comment le service AWS Glue traite-t-il les erreurs ?

AWS Glue surveille les mesures et les erreurs des événements de tâche et envoie toutes les notifications à Amazon CloudWatch. Avec Amazon CloudWatch, vous pouvez configurer toute une série d'actions déclenchables en fonction de des notifications particulières provenant d'AWS Glue. Par exemple, si vous obtenez une notification d'erreur ou de réussite de Glue, vous pouvez déclencher une fonction AWS Lambda. En outre, le service Glue lance par défaut trois nouvelles tentatives après échec, avant d'envoyer une notification d'erreur.

Q : Puis-je exécuter mes tâches ETL existantes avec AWS Glue ?

Oui. Vous pouvez exécuter votre code Scala ou Python existant dans AWS Glue. Téléchargez simplement le code vers Amazon S3 et créez une ou plusieurs tâches qui utilisent ce code. Vous pouvez réutiliser le même code sur plusieurs tâches en pointant vers le même emplacement de code sur Amazon S3.

Q : Comment puis-je utiliser AWS Glue pour diffuser les données ETL ?

L'extraction, le transport et le chargement (ETL) des données avec AWS Glue s'effectue par lot et vous pouvez planifier vos tâches ETL par intervalles de 5 minutes minimum. Bien que le service puisse traiter des micro-lots, il ne traite pas les données diffusées. Si votre cas d'utilisation exige l'extraction, le transport, et le chargement de données pendant leur diffusion, vous pouvez effectuer la première partie de la tâche ETL en utilisant, Amazon Kinesis Data Firehose ou Amazon Kinesis Data Analytics, puis stocker les données vers Amazon S3 ou Amazon Redshift et déclencher une tâche ETL Glue pour récupérer cet ensemble de données et continuer à y appliquer des transformations supplémentaires.

Q : Faut-il utiliser à la fois le catalogue de données AWS Glue et ETL Glue pour utiliser le service ?

Non. Bien que nous pensions que l'utilisation du catalogue de données AWS Glue et le service d'extraction, de transport et de chargement (ETL) des données fournissent une expérience ETL de bout en bout, vous pouvez les utiliser indépendamment l'un de l'autre.

Nettoyage et déduplication des données

Q : Quel genre de problèmes permettent de résoudre le ML Transform de FindMatches ?

FindMatches permet généralement de résoudre des problèmes d’association d’archives et de déduplication de données. La déduplication est ce que vous obtenez lorsque vous tentez d’identifier des archives dans une base de données conceptuellement « identique », mais pour laquelle vous disposez d’archives distinctes. Ce problème est mineur si les archives dupliquées peuvent être identifiées par une clé unique (par exemple si les produits peuvent être identifiés de manière unique par un code UPC),mais il peut prendre de l’ampleur si vous avez besoin de chercher une « correspondance approximative ».

Dans les grandes lignes, l’association d’archive est le même problème que la déduplication de données, mais ce terme signifie généralement que vous réalisez une « association approximative » de deux bases de données ne partageant pas une clé unique plutôt qu’une déduplication d’une seule base de données. Par exemple, prenons le problème de correspondance d’une grande base de données de clients à une petite base de données de fraudeurs connus. FindMatches peut servir pour les problèmes d’association d’archive et de déduplication.

Par exemple, le ML Transform de FindMatches d’AWS Glue peut vous aider pour les problèmes suivants :

Associer des archives de patients entre les hôpitaux pour que les médecins aient davantage d’informations contextuelles et soient capables de les soigner grâce à FindMatches sur des bases de données séparées contenant des champs courants que le nom, la date de naissance, l’adresse postale, le numéro de téléphone, etc.

Déduplication d’une base de données de films contenant des colonnes comme « titre », « synopsis », « année de sortie », « durée » et « distribution ». Par exemple, le même film pourrait être identifé de diverses manières, comme « Star Wars », « Star Wars: A New Hope » et « Star Wars: Episode IV—A New Hope (Special Edition) ».

Regroupez automatiquement tous les produits associés dans votre devanture en identifiant des éléments équivalents dans un catalogue de produits vestimentaires dans lequel vous souhaitez définir « équivalent » pour signifier qu’ils sont identiques en ignorant les différences de taille et de couleur. Ainsi, « Jean Levi’s 501 bleu, taille 34x34 » est défini comme étant le même niveau que « Jean Levi’s 501 noir, taille 32x31 ».

Q : Comment AWS Glue déduplique-t-il mes données ?

Le ML Transform de FindMatches d’AWS Glue simplifie la recherche et l’association d’archives faisant référence à la même entité mais qui ne partagent pas un identifieur fiable. Avant FindMatches, les développeurs devaient généralement résoudre les problèmes courants de correspondance de données de manière déterministe en rédigeant d’importantes quantités de règles ajustées à la main. FindMatches exploite des algorithmes de machine learning en arrière-plan pour apprendre à faire correspondre des archives en fonction des critères commerciaux de chaque développeur. FindMatches identifie en premier lieu les archives que le client doit marquer comme correspondantes ou non, puis utilise le machine learning pour créer un ML Transform. Les clients peuvent alors exécuter ce Transform sur leurs bases de données pour rechercher des archives correspondantes ou interroger FindMatches pour avoir d’autres archives à marquer et faire évoluer le niveau de précision du ML Transform.

Q: Que sont les ML Transforms ?

Les ML Transforms fournissent une destination de création et de gestion des transformateurs basés sur le machine-learning. Une fois créés et formés, les ML Transforms peuvent alors être exécutés dans des scripts AWS Glue standard. Les clients sélectionnent un algorithme spécifique (par exemple, le ML Transform de FindMatches) et saisissez des ensembles de données et des exemples de formation, puis les paramètres d’ajustement requis par cet algorithme. AWS Glue utilise ces saisies pour créer un ML Transform pouvant être incorporé dans un flux de travail ETL Job normal.

Q : Comment fonctionnent les ML Transforms ?

AWS Glue inclut des algorithmes de transformation d’ensemble de données basés sur le ML que les clients peuvent utiliser afin de créer leurs propres ML Transforms. Ces derniers incluent la déduplication d’archives et la recherche de correspondance.

Les clients commencent par se rendre dans l’onglet ML Transforms de la console (ou par utiliser les points de terminaison ML Transforms ou par accéder à la formation des ML Transforms via la CLI) pour créer leur premier modèle de ML Transform. L’onglet ML Transforms donne une vue simple pour la gestion des transformateurs des utilisateurs. Les ML Transforms requièrent des exigences distinctes de flux de travail d’autres transformateurs, notamment : le besoin de formation séparée, l’ajustement de paramètres et des flux de travail d’exécution ; le besoin d’évaluer des métriques de la qualité de transformations générées ; et le besoin de gérer et collecter des étiquettes vraies pour la formation et l’apprentissage actif..

Pour créer un ML Transform via la console, les clients commencent par sélectionner le type de transformateur (déducplication ou correspondance d’archive, par exemple) et indiquent les sources de données appropriées découvertes dans le catalogue de données. Selon le transformateur, il peut ensuite être demandé aux clients d’indiquer les données d’étiquette vraie de base pour la formation ou d’autres paramètres. Les clients peuvent surveiller le statut de leurs tâches de formation et consulter des métriques sur la qualité pour chaque transformateur. (Les métriques de la qualité sont reportées grâce à un ensemble de sécurité de données d’étiquettes fournies Quality metrics are par le client.)

Dès que les performances sont satisfaisantes, les clients peuvent promouvoir les modèles des ML Transforms à utiliser en promotion. Les ML Transforms peuvent alors être utilisés lors des flux de travail ETL, à la fois dans du code généré automatiquement par le service et dans des scripts définis par l’utilisateur envoyés avec d’autres tâches, semblables à des transformations préconçues proposées dans d’autres bibiliothèques AWS Glue.

Q : Puis-je voir une présentation de l’utilisation d’AWS Glue (et d’AWS Lake Formation) pour la recherche de correspondances et d’archives dédupliquées ?

R : Oui. L’enregistrement complet de la discussion en ligne sur la technologie AWS "Fuzzy Matching and Deduplicating Data with ML Transforms for AWS Lake Formation" est disponible ici.

Intégrations de produits AWS

Q : Quand faut-il utiliser AWS Glue plutôt que AWS Data Pipeline ?

AWS Glue fournit un service ETL géré qui est exécuté dans un environnement Apache Spark sans serveur. Ceci vous permet de vous concentrer sur vos tâches ETL au lieu de vous inquiéter de la configuration et de la gestion des ressources de calcul sous-jacentes. AWS Glue suit l'approche de priorisation des données et vous permet de vous concentrer sur les propriétés et la manipulation des données pour les transformer de telle sorte que vous pouvez en tirer des informations importantes pour votre entreprise. Ce service fournit un catalogue de données intégrées qui rend les métadonnées disponibles pour leur extraction, transport et chargement (ETL) ainsi que pour leur interrogation via Amazon Athena et Amazon Redshift Spectrum.

AWS Data Pipeline fournit un service d'orchestration gérée qui vous donne une plus grande flexibilité en termes d'environnement d'exécution, d'accès et de contrôle sur les ressources de calcul qui exécutent votre code ainsi que sur le code lui-même qui réalise le traitement des données. AWS Data Pipeline lance les ressources de calcul dans votre compte et vous donne un accès direct aux instances Amazon EC2 ou aux clusters Amazon EMR.

De plus, les tâches ETL AWS Glue sont basées sur Scala ou Python. Si votre cas d'utilisation exige que vous utilisiez un moteur autre qu'Apache Spark ou si vous voulez exécuter un ensemble de tâches hétérogènes sur différents moteurs tels que Hive, Pig, etc., AWS Data Pipeline est un meilleur choix.

Q : Quand faut-il utiliser AWS Glue plutôt qu’Amazon EMR ?

AWS Glue fonctionne sur l'environnement Apache Spark pour fournir un environnement d'exécution à dimensionnement progressif pour les tâches de transformation de vos données. AWS Glue fait des déductions, évolue et surveille vos tâches ETL et simplifie grandement le processus de création et de maintenance des tâches. Amazon EMR vous permet d'avoir un accès direct à votre environnement Hadoop et vous accorde un accès au plus bas niveau et une plus grande flexibilité dans l'utilisation d'outils en dehors de Spark.

Q : Quand faut-il utiliser AWS Glue plutôt qu'AWS Database Migration Service ?

AWS Database Migration Service (DMS) vous aide à migrer vos bases de données vers AWS aisément et en toute sécurité. Pour les cas d'utilisation qui exigent une migration de la base de données du site vers AWS ou une réplication de la base de données entre les sources sur site et les sources sur AWS, nous recommandons l'utilisation d'AWS DMS. Une fois que vos données se trouvent dans AWS, vous pouvez utiliser AWS Glue pour les déplacer et les transformer depuis votre source de données vers une autre base de données ou un entrepôt de données, tels qu'Amazon Redshift.

Q : Quand faut-il utiliser AWS Glue plutôt qu'AWS Batch ?

AWS Batch vous permet de facilement et efficacement exécuter toute tâche de calcul par lots sur AWS quelle que soit la nature de la tâche. AWS Batch crée et gère les ressources de calcul dans votre compte AWS et vous donne ainsi le contrôle et la visibilité des ressources utilisées. AWS Glue est un service ETL entièrement géré qui fournit un environnement Apache Spark sans serveur pour exécuter vos tâches d'extraction, de transport et de chargement (ETL) des données. Pour vos cas d'utilisation ETL, nous recommandons que vous exploriez l'utilisation d'AWS Glue. Pour les autres cas d'utilisation par lots, y compris certains cas d'utilisation ETL, AWS Batch peut être préférable.

Q : Quand faut-il utiliser AWS Glue plutôt qu'Amazon Kinesis Data Analytics ?

Amazon Kinesis Data Analytics vous permet d'exécuter des requêtes SQL standard sur votre flux de données entrant. Vous pouvez préciser une destination comme Amazon S3 pour écrire vos résultats. Une fois que vos données sont disponibles dans votre source de données cible, vous pouvez lancer une tâche ETL AWS Glue pour les transformer davantage et les préparer dans le but d'analyses et de rapports supplémentaires.

Tarification et facturation

Q : Comment est facturée l'utilisation d'AWS Glue ?

Au-delà du niveau gratuit du catalogue de données AWS Glue, vous ne payez qu'un forfait mensuel simple pour stocker les métadonnées dans le catalogue de données AWS Glue et y accéder. En outre, vous serez facturé à un tarif horaire, décompté à la seconde, pour les tâches ETL et l'exécution des robots d'analyse (minimum de 10 minutes pour chacun). Si vous choisissez d'utiliser un point de terminaison de développement pour développer interactivement votre code ETL, vous serez facturé un tarif horaire, décompté à la seconde, pour la mise en service du point de terminaison de développement (minimum de 10 minutes). Pour en savoir plus, consultez notre page sur la tarification.

Q : Quand commence et se termine la facturation de mes tâches AWS Glue ?

La facturation commence dès que la tâche est planifiée pour exécution et continue jusqu'à ce qu'elle soit terminée. Avec AWS Glue, vous ne payez que pour le durée d'exécution de votre tâche et non pour la mise en service de l'environnement ou les temps d'arrêt.

Sécurité et disponibilité

Q : Comment le service AWS Glue assure-t-il la sécurité de mes données ?

Nous fournissons un chiffrement côté serveur pour les données au repos et SSL pour les données en mouvement.

Q : Quelles sont les limites de service associées à AWS Glue ?

Pour en savoir plus sur les limites de service, consultez notre documentation.

Q : Dans quelles régions le service AWS Glue est-il disponible ?

Pour plus d'informations sur la disponibilité d'AWS Glue service par région, reportez-vous à la section relative au tableau des régions AWS.

Q : Combien d'unités de traitement des données (DPU) sont allouées au point de terminaison de développement ?

Par défaut, un point de terminaison de développement est mis en service avec 5 DPU. Vous pouvez configurer un point de terminaison de développement avec un minimum de 2 DPU et un maximum de 5 DPU.

Q : Comment puis-je adapter la taille et la performance de mes tâches ETL AWS Glue ?

Vous pouvez simplement spécifier le nombre de DPU (units de traitement des données) que vous voulez allouer à votre tâche ETL. Une tâche ETL Glue exige un minimum de 2 DPU. Par défaut, AWS Glue alloue 10 DPU à chaque tâche ETL.

Q : Comment puis-je surveiller l'exécution de mes tâches AWS Glue ?

AWS Glue indique l'état de chaque tâche et envoie toutes les notifications vers Amazon CloudWatch. Vous pouvez configurer les notifications SNS par le biais d'actions CloudWatch pour être informé de l'échec ou de la fin d'une tâche.

Contrat de niveau de service

Q : Que garantit le contrat de niveau de service (SLA) d'AWS Glue ?

Notre contrat de niveau de service AWS Glue garantit un pourcentage de temps de fonctionnement mensuel d'au moins 99,9 % pour AWS Glue.

Q : Comment savoir si je peux bénéficier d'un crédit de service au titre du contrat de niveau de service ?

Vous avez droit à un crédit dans le cadre d’un SLA AWS Glue lorsque plusieurs zones de disponibilité dans lesquelles vous exécutez une tâche, au sein de la même région, présentent un pourcentage de fonctionnement mensuel inférieur à 99,9 % pendant un cycle mensuel de facturation.

Pour consulter l'intégralité des conditions générales du SLA et en savoir plus sur la marche à suivre pour soumettre une demande, référez-vous à la page détaillée du SLA AWS Glue.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Visiter la page de tarification

Explorez les options de tarification pour AWS Glue.

En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencer à créer sur la console

Commencez à créer avec AWS Glue dans AWS Management Console.

Se connecter