AWS Glue
Découvrez, préparez et intégrez toutes vos données à n'importe quelle échelle
Un million d'objets stockés gratuitement
Fonctionnement
AWS Glue est un service d'intégration des données sans serveur qui facilite la découverte, la préparation, le déplacement et l'intégration des données depuis des sources multiples pour l'analytique, le machine learning (ML) et le développement des applications.
-
Options des moteurs d'intégration des données
-
ETL basé sur les événements
-
Catalogue de données AWS Glue
-
Tâches ETL sans code
-
Gérer et contrôler la qualité des données
-
Préparation des données
-
Options des moteurs d'intégration des données
-
Sélectionnez votre moteur d'intégration des données favori dans AWS Glue pour prendre en charge vos utilisateurs et vos charges de travail.
-
ETL basé sur les événements
-
AWS Glue peut exécuter vos tâches d'extraction, de transformation et de chargement (ETL) à mesure que les nouvelles données arrivent. Par exemple, vous pouvez configurer AWS Glue pour que vos tâches ETL s'exécutent dès que de nouvelles données sont disponibles dans Amazon Simple Storage Service (S3).
-
Catalogue de données AWS Glue
-
Vous pouvez utiliser le catalogue de données pour la découverte et la recherche rapides sur plusieurs jeux de données AWS sans devoir déplacer les données. Une fois que les données sont cataloguées, elles sont immédiatement disponibles pour la recherche et l'interrogation avec Amazon Athena, Amazon EMR et Amazon Redshift Spectrum.
-
Tâches ETL sans code
-
AWS Glue Studio facilite la création, l'exécution et la surveillance visuelles des tâches ETL dans AWS Glue. Vous pouvez créer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer. AWS Glue génère automatiquement le code.
-
Gérer et contrôler la qualité des données
-
AWS Glue Data Quality automatise la création, la gestion et la surveillance des règles de qualité des données afin de garantir des données de haute qualité dans vos lacs et pipelines de données.
-
Préparation des données
-
AWS Glue DataBrew vous permet d'explorer et d'expérimenter avec des données provenant directement de votre lac de données, de vos entrepôts de données et de vos bases de données, y compris Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora et Amazon Relational Database Service (RDS). Vous pouvez choisir parmi plus de 250 transformations pré-intégrées dans DataBrew pour automatiser les tâches de préparation des données, telles que le filtrage des anomalies, la normalisation des formats et la correction des valeurs non valides.
Cas d'utilisation
Simplifier le développement de pipeline ETL
Supprimez la gestion de l'infrastructure grâce à l'allocation automatique et à la gestion des travailleurs, et regroupez tous vos besoins en matière d'intégration de données en un seul service.
Identifier efficacement les données
Identifiez rapidement les données dans plusieurs jeux de données AWS, puis mettez-les instantanément à disposition pour les interroger et les transformer.
Explorer, expérimenter et traiter les données de manière interactive
Grâce aux sessions interactives AWS Glue, les ingénieurs de données peuvent explorer et préparer les données de manière interactive en utilisant l'environnement de développement intégré (IDE) ou le bloc-notes de leur choix.
Prendre en charge divers cadres de traitement et charges de travail
Prise en charge plus facile de divers cadres de traitement des données, tels que ETL et ELT, et de diverses charges de travail, y compris batch, micro-batch et streaming.
Clients
Comment démarrer
Essayer gratuitement AWS Glue
Découvrez, préparez, déplacez et intégrez des données provenant de sources multiples avec la facilité d'un environnement sans serveur.
Développer avec AWS Glue
Apprenez à créer des pipelines de données avec l'interface ETL visuelle AWS Glue Studio.
Intégrer vos données
Suivez les instructions pour configurer et commencer à utiliser AWS Glue.