Publié le: Nov 13, 2020

Les requêtes fédérées dans Amazon Athena permettent aux utilisateurs d'exécuter des requêtes SQL sur des données stockées dans des sources de données relationnelles, non relationnelles, d'objets et personnalisées. Désormais disponible pour tous dans les régions us-east-1, us-west-2 et us-east-2, cette fonctionnalité permet aux clients de soumettre une requête SQL unique qui analyse les données provenant de diverses sources hébergées sur site ou dans le cloud.  

L’exécution de l'analyse sur des données disséminées dans des applications peut être à la fois complexe et chronophage. Les données nécessaires aux analyses sont souvent réparties dans des magasins de données relationnels, clés-valeurs, de documents, en mémoire, de recherche, de graphiques, d'objets, de séries chronologiques et de registres. Pour analyser les données provenant de ces sources, les analystes construisent des pipelines complexes pour extraire, transformer et charger les données dans un entrepôt afin qu’elles puissent être interrogées. L'accès aux données provenant de différentes sources nécessite l'apprentissage de nouveaux langages de programmation et de nouveaux concepts d'accès aux données. Les requêtes SQL fédérées dans Athena éliminent cette complexité en permettant aux utilisateurs d'interroger les données sur place, où qu'elles se trouvent. Les analystes peuvent utiliser des structures SQL courantes pour associer (JOIN) des données sur plusieurs sources de données pour une analyse rapide et stocker les résultats dans Amazon S3 pour une utilisation ultérieure. 

Athena exécute des requêtes fédérées à l'aide de connecteurs de sources de données Athena s'exécutant sur AWS Lambda. AWS dispose de connecteurs de sources de données open source pour Amazon DynamoDB, Apache HBase, Amazon Document DB, Amazon Redshift, AWS CloudWatch, AWS CloudWatch Metrics, et les bases de données relationnelles conformes JDBC telles que MySQL et PostgreSQL sous licence Apache 2.0. Les clients peuvent utiliser ces connecteurs pour exécuter des requêtes SQL fédérées dans Athena sur ces sources de données. En outre, avec Athena Query Federation SDK, les développeurs peuvent créer des connecteurs vers n'importe quelle source de données pour permettre à Athena d'exécuter des requêtes SQL sur cette source de données. Athena Query Federation Connector étend les avantages des requêtes fédérées au-delà des connecteurs fournis par AWS. Comme les connecteurs fonctionnent sur AWS Lambda, les clients n'ont pas besoin de gérer l'infrastructure ni de planifier la mise à l'échelle pour répondre aux pics de demandes.

Avec cette publication, les requêtes fédérées Athena sont disponibles pour tous dans les régions us-east-1, us-west-2 et us-east-2. 

Pour en savoir plus sur cette fonctionnalité, consultez la documentation ici.
Pour commencer à utiliser un connecteur existant, suivez ce guide.
Pour savoir comment créer votre propre connecteur de source de données à l’aide d’Athena Query Federation SDK, utilisez ce lien.