Publié le: Nov 17, 2023

AWS Glue pour Apache Spark prend désormais en charge la connectivité native à Amazon OpenSearch Service, ce qui permet aux utilisateurs de lire et d'écrire efficacement des données depuis Amazon OpenSearch Service sans avoir à installer ou gérer les bibliothèques de connecteurs OpenSearch. Les utilisateurs peuvent désormais utiliser les données stockées dans les index d'OpenSearch Service comme source ou cible dans l'interface visuelle sans code par glisser-déposer d'AWS Glue Studio ou directement dans un script de tâche AWS Glue ETL. Associé aux fonctionnalités ETL (Extract, Transform, Load) d'AWS Glue, ce nouveau connecteur simplifie la création de pipelines ETL, ce qui permet aux développeurs ETL de gagner du temps lors de la création et de la maintenance des pipelines de données.

Pour commencer, créez une nouvelle connexion Amazon OpenSearch Service dans le catalogue de données AWS Glue et ajoutez une source ou une cible OpenSearch Service à votre tâche Glue ETL. Lors de la lecture à partir d'OpenSearch Service, les développeurs peuvent choisir un index OpenSearch Service complet comme source ou soumettre une requête pour sélectionner des données d'index spécifiques. Lorsqu'ils écrivent dans OpenSearch Service, les utilisateurs peuvent enrichir, nettoyer et transformer des données dans Glue avant de charger les résultats dans un index OpenSearch Service. Ces fonctionnalités permettent aux développeurs ETL de travailler avec OpenSearch Service et AWS Glue dans divers scénarios.

Cette fonctionnalité est proposée dans toutes les régions AWS où AWS Glue est disponible. Pour en savoir plus, consultez la documentation relative à AWS Glue.