Publié le: Nov 26, 2019
Amazon Athena permet d'exécuter des requêtes SQL sur les données stockées dans des sources de données relationnelles, non relationnelles, d'objets et personnalisées. Grâce aux requêtes fédérées, les clients peuvent soumettre une seule requête SQL qui analyse les données provenant de plusieurs sources exécutées sur site ou hébergées dans le cloud.
L’exécution de l'analyse sur des données disséminées dans des applications peut être à la fois complexe et chronophage. Les données nécessaires aux analyses sont souvent réparties dans des magasins de données relationnels, valeurs clés, de documents, en mémoire, de recherche, de graphiques, d'objets, de séries chronologiques et de grand livre. Pour analyser les données provenant de ces sources, les analystes construisent des pipelines complexes pour extraire, transformer et charger un entrepôt de données afin que les données puissent être interrogées. L'accès aux données provenant de différentes sources nécessite l'apprentissage de nouveaux langages de programmation et de nouveaux concepts d'accès aux données. Les requêtes SQL fédérées dans Athena éliminent cette complexité en permettant aux utilisateurs d'interroger les données sur place, où qu'elles se trouvent. Les analystes peuvent utiliser des structures SQL familières pour associer des données à plusieurs sources de données pour une analyse rapide et stocker les résultats dans Amazon S3 pour une utilisation ultérieure.
Athena exécute des requêtes fédérées à l'aide de connecteurs de source de données Athena s'exécutant sur AWS Lambda. AWS dispose de connecteurs de source de données open source pour Amazon DynamoDB, Apache HBase, Amazon Document DB, Amazon Redshift, AWS CloudWatch, AWS CloudWatch Metrics, et les bases de données relationnels JDBC telles que MySQL et PostgreSQL sous licence Apache 2.0. Les clients peuvent utiliser ces connecteurs pour exécuter des requêtes SQL fédérées dans Athena sur ces sources de données. En outre, avec Athena Query Federation SDK, les développeurs peuvent créer des connecteurs vers n'importe quelle source de données pour permettre à Athena d'exécuter des requêtes SQL sur cette source de données. Athena Query Federation Connector étend les avantages des requêtes fédérées au-delà des connecteurs fournis par AWS. Comme les connecteurs fonctionnent sur AWS Lambda, les clients n'ont pas besoin de gérer l'infrastructure ni de planifier la mise à l'échelle pour répondre aux demandes les plus exigeantes.
La requête fédérée Athena est disponible en version préliminaire dans la région USA Est 1 (Virginie du Nord). Accédez dès maintenant à votre version préliminaire en suivant ces étapes.
Pour en savoir plus sur cette fonctionnalité, consultez la documentation ici.
Pour commencer à utiliser un connecteur existant, suivez ce guide.
Pour savoir comment créer votre propre connecteur de source de données à l’aide du kit SDK Athena Query Federation, utilisez ce lien.