Publié le: Nov 17, 2023

AWS Glue pour Apache Spark annonce le lancement de six nouveaux connecteurs de base de données : Teradata, SAP HANA, Azure SQL, Azure Cosmos DB, Vertica et MongoDB. Ces connecteurs natifs permettent aux utilisateurs de lire et d'écrire efficacement les données de ces systèmes sans avoir à installer ou à gérer de bibliothèques de connecteurs. Les utilisateurs peuvent désormais ajouter ces bases de données en tant que source ou cible dans l'interface visuelle sans code et par glisser-déposer d'AWS Glue Studio, ou utiliser le connecteur directement dans un script de tâche AWS Glue ETL.

Pour Teradata, SAP HANA, Azure SQL et Vertica, les utilisateurs peuvent spécifier une seule table ou saisir une requête personnalisée pour sélectionner leurs données. Pour MongoDB, ils peuvent spécifier la collection de documents. Pour Azure Cosmos DB, ils peuvent spécifier le conteneur et éventuellement fournir une requête personnalisée. Lors de la création de tâches ETL visuelles, ils peuvent prévisualiser leur jeu de données source pour trouver les bonnes données plus rapidement. Les utilisateurs peuvent également utiliser ces bases de données comme cibles dans leurs pipelines ETL pour écrire le résultat des étapes de transformation.

Ces fonctionnalités permettent à un développeur ETL de travailler avec AWS Glue et les bases de données prises en charge dans diverses situations de données au sein d'une seule interface. Pour commencer, créez une nouvelle connexion dans AWS Glue avec la base de données de votre choix et ajoutez-la en tant que source ou cible à votre tâche Glue ETL.

Cette fonctionnalité est proposée dans toutes les régions AWS où AWS Glue est disponible.

Pour en savoir plus, consultez la documentation relative à AWS Glue.