Pourquoi choisir AWS Glue ?
Préparer vos données pour obtenir des résultats de qualité est la première étape d'un projet analytique ou de ML. AWS Glue est un service d'intégration des données sans serveur qui facilite et accélère la préparation des données, et en réduit les coûts. Vous pouvez découvrir plus de 70 sources de données diverses et vous y connecter, gérer vos données dans un catalogue de données centralisé, et créer, exécuter et surveiller visuellement des pipelines ETL pour charger des données dans vos lacs de données.
Présentation d'AWS Glue (01:54)

Fonctionnement

AWS Glue est un service d'intégration des données sans serveur qui facilite la découverte, la préparation, le déplacement et l'intégration des données depuis des sources multiples pour l'analytique, le machine learning (ML) et le développement des applications.

  • Options des moteurs d'intégration des données
  • Sélectionnez votre moteur d'intégration des données favori dans AWS Glue pour prendre en charge vos utilisateurs et vos charges de travail.

    Le diagramme présente plusieurs options de moteurs de traitement des données pour AWS Glue.
  • ETL basé sur les événements
  • AWS Glue peut exécuter vos tâches d'extraction, de transformation et de chargement (ETL) à mesure que les nouvelles données arrivent. Par exemple, vous pouvez configurer AWS Glue pour que vos tâches ETL s'exécutent dès que de nouvelles données sont disponibles dans Amazon Simple Storage Service (S3).

    Diagramme indiquant comment AWS Glue peut exécuter vos tâches ETL à mesure que les nouvelles données arrivent.
  • Catalogue de données AWS Glue
  • Vous pouvez utiliser le catalogue de données pour la découverte et la recherche rapides sur plusieurs jeux de données AWS sans devoir déplacer les données. Une fois que les données sont cataloguées, elles sont immédiatement disponibles pour la recherche et l'interrogation avec Amazon Athena, Amazon EMR et Amazon Redshift Spectrum.

    Diagramme montrant le catalogue de données découvrant et recherchant des jeux de données sans déplacer les données.
  • Tâches ETL sans code
  • AWS Glue Studio facilite la création, l'exécution et la surveillance visuelles des tâches ETL dans AWS Glue. Vous pouvez créer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer. AWS Glue génère automatiquement le code.

    Diagramme indiquant comment les utilisateurs peuvent composer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer.
  • Gérer et contrôler la qualité des données
  • AWS Glue Data Quality automatise la création, la gestion et la surveillance des règles de qualité des données afin de garantir des données de haute qualité dans vos lacs et pipelines de données.

    Le diagramme présente comment AWS Glue Data Quality mesure, surveille et gère automatiquement la qualité des données dans les lacs et les pipelines de données.
  • Préparation des données
  • AWS Glue DataBrew vous permet d'explorer et d'expérimenter avec des données provenant directement de votre lac de données, de vos entrepôts de données et de vos bases de données, y compris Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora et Amazon Relational Database Service (RDS). Vous pouvez choisir parmi plus de 250 transformations pré-intégrées dans DataBrew pour automatiser les tâches de préparation des données, telles que le filtrage des anomalies, la normalisation des formats et la correction des valeurs non valides.

    Diagramme indiquant comment DataBrew automatise les tâches de préparation des données pour les utilisateurs.

Nouveautés

  • Date (de la plus récente à la plus ancienne)
Aucun résultat correspondant
1

Découvrir davantage sur AWS