AWS Glue

Découvrez, préparez et intégrez toutes vos données à n'importe quelle échelle

Un million d'objets stockés gratuitement

Fonctionnement

AWS Glue est un service d'intégration des données sans serveur qui facilite la découverte, la préparation, le déplacement et l'intégration des données depuis des sources multiples pour l'analytique, le machine learning et le développement des applications.

  • ETL basé sur les événements
  • AWS Glue peut exécuter vos tâches d'extraction, de transformation et de chargement (ETL) à mesure que les nouvelles données arrivent. Par exemple, vous pouvez configurer AWS Glue pour que vos tâches ETL s'exécutent dès que de nouvelles données sont disponibles dans Amazon Simple Storage Service (S3).

    Diagramme indiquant comment AWS Glue peut exécuter vos tâches ETL à mesure que les nouvelles données arrivent.
  • Catalogue de données AWS Glue
  • Vous pouvez utiliser le catalogue de données pour la découverte et la recherche rapides sur plusieurs jeux de données AWS sans devoir déplacer les données. Une fois que les données sont cataloguées, elles sont immédiatement disponibles pour la recherche et l'interrogation avec Amazon Athena, Amazon EMR et Amazon Redshift Spectrum.

    Diagramme montrant le catalogue de données découvrant et recherchant des jeux de données sans déplacer les données.
  • Tâches ETL sans code
  • AWS Glue Studio facilite la création, l'exécution et la surveillance visuelles des tâches ETL dans AWS Glue. Vous pouvez créer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer. AWS Glue génère automatiquement le code.

    Diagramme indiquant comment les utilisateurs peuvent composer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer.
  • Préparation des données en libre-service
  • AWS Glue DataBrew vous permet d'explorer et d'expérimenter avec des données provenant directement de votre lac de données, de vos entrepôts de données et de vos bases de données, y compris Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora et Amazon Relational Database Service (RDS). Vous pouvez choisir parmi plus de 250 transformations pré-intégrées dans DataBrew pour automatiser les tâches de préparation des données, telles que le filtrage des anomalies, la normalisation des formats et la correction des valeurs non valides.

    Diagramme indiquant comment DataBrew automatise les tâches de préparation des données pour les utilisateurs.
Présentation d’AWS Glue (01:54)
Pourquoi choisir AWS Glue ?
Préparer vos données pour obtenir des résultats de qualité est la première étape d'un projet analytique ou de ML. AWS Glue est un service d'intégration des données sans serveur qui facilite et accélère la préparation des données, et en réduit les coûts. Vous pouvez découvrir plus de 70 sources de données diverses et vous y connecter, gérer vos données dans un catalogue de données centralisé, et créer, exécuter et surveiller visuellement des pipelines ETL pour charger des données dans vos lacs de données.

Cas d'utilisation

Simplifier le développement de pipeline ETL

Supprimez la gestion de l'infrastructure grâce à l'allocation automatique et à la gestion des travailleurs, et regroupez tous vos besoins en matière d'intégration de données en un seul service.

En savoir plus sur AWS Glue Auto Scaling »

Identifier efficacement les données

Identifiez rapidement les données dans plusieurs jeux de données AWS, puis mettez-les instantanément à disposition pour les interroger et les transformer.

En savoir plus sur le catalogue de données AWS Glue »

Explorer, expérimenter et traiter les données de manière interactive

Grâce aux sessions interactives AWS Glue, les ingénieurs de données peuvent explorer et préparer les données de manière interactive en utilisant l'environnement de développement intégré (IDE) ou le bloc-notes de leur choix.

En savoir plus sur les sessions interactives AWS Glue »

Prendre en charge divers cadres de traitement et charges de travail

Prise en charge plus facile de divers cadres de traitement des données, tels que ETL et ELT, et de diverses charges de travail, y compris batch, micro-batch et streaming.

En savoir plus sur le streaming de tâches ETL »

Comment démarrer

Essayer gratuitement AWS Glue

Découvrez, préparez, déplacez et intégrez des données provenant de sources multiples avec la facilité d'un environnement sans serveur.

Développer avec AWS Glue

Apprenez à créer des pipelines de données avec l'interface ETL visuelle AWS Glue Studio.

Intégrer vos données

Suivez les instructions pour configurer et commencer à utiliser AWS Glue.


En savoir plus sur AWS