Amazon Athena est un service de requêtes interactif qui facilite l'analyse de données directe dans Amazon S3 grâce au SQL standard. En quelques clics dans AWS Management Console, les clients peuvent pointer Athena vers leurs données stockées dans S3 et commencer à utiliser le standard SQL pour exécuter des requêtes interactives et obtenir des résultats en quelques secondes. Athena fonctionne sans serveur. Il n'y a donc aucune infrastructure à configurer ou à gérer, et les clients ne paient que les requêtes qu'ils exécutent. Vous pouvez utiliser Athena pour traiter des journaux, réaliser des analyses de données et exécuter des requêtes interactives. Athena s'adapte automatiquement, en exécutant les requêtes en parallèle. Les résultats sont donc rapides, même avec de grands ensembles de données et des requêtes complexes.
Sans serveur. Aucune infrastructure. Aucune tâche d'administration
Amazon Athena fonctionne sans serveur. Il n'y a donc aucune infrastructure à gérer. Vous n'avez pas à vous soucier de la configuration, des mises à jour logicielles, ni du dimensionnement de votre infrastructure à mesure que les ensembles de données et le nombre d'utilisateurs augmentent. Athena s'en charge automatiquement à votre place. Vous pouvez donc vous concentrer sur les données et pas sur l'infrastructure.
Démarrage facile
Pour démarrer, connectez-vous à la console Athena, définissez votre schéma à l'aide de l'assistant de la console ou en saisissant des instructions DDL, et commencez immédiatement à lancer vos requêtes à l'aide de l'éditeur de requêtes intégré. Enfin, AWS Glue peut aussi analyser automatiquement des sources de données afin de découvrir des schémas et alimenter votre catalogue de données avec des tables nouvelles ou mises à jour tout en partitionnant les données Les résultats s'affichent dans la console dans les secondes qui suivent et sont automatiquement écrits dans l'emplacement de votre choix dans S3. Vous pouvez également les télécharger sur votre bureau. Avec Athena, inutile d'exécuter des tâches ETL complexes pour préparer vos données en vue de leur analyse. Cela permet à quiconque possédant des compétences SQL d'analyser rapidement des ensembles à grande échelle.
Simplification du lancement des requêtes avec le SQL standard
Amazon Athena utilise Presto, un moteur de requêtes SQL distribué open source, optimisé pour l'analyse interactive des données avec un faible temps de latence. Vous pouvez ainsi exécuter des requêtes sur de grands ensembles de données dans Amazon S3 à l'aide du SQL ANSI, avec prise en charge totale des liaisons de volumes importants, des fonctions de fenêtre et des tableaux. Athena prend en charge un large éventail de formats de données tels que CSV, JSON, ORC, Avro ou Parquet. Avec les connecteurs de sources de données fédérées d’Athena, vous pouvez interroger des banques de données supplémentaires et associer les données aux données stockées dans Amazon S3. Vous pouvez accéder à Athena et exécuter des requêtes à partir de la console Athena, API, CLI, SDK AWS et des applications d’informatique décisionnelle et de développement SQL prises en charge via les pilotes JDBC et ODBC d’Athena.
Facturation à la requête
Avec Amazon Athena, vous ne payez que pour les requêtes que vous exécutez. Vous êtes facturé en fonction de la quantité de données analysées par chaque requête. Vous pouvez réaliser des économies importantes et bénéficier de meilleures performances en compressant vos données, en les partitionnant ou en les convertissant dans un format en colonnes, car chacune de ces opérations réduit la quantité de données qu'Athena doit analyser pour exécuter une requête.
Performances rapides
Avec Amazon Athena, vous n'avez pas à vous soucier de la gestion ou du réglage des clusters pour obtenir des performances élevées. Athena est un service optimisé pour offrir des performances rapides avec Amazon S3. Athena exécute automatiquement les requêtes en parallèle pour vous offrir des résultats en quelques secondes, même dans le cas de grands ensembles de données.
Hautement disponible et durable
Amazon Athena est une solution hautement disponible qui exécute des requêtes à l'aide de ressources de calcul situées dans différentes installations, en acheminant correctement les requêtes lorsqu'une installation spécifique n'est pas disponible. Athena utilise Amazon S3 comme banque de données sous-jacente, ce qui garantit des données hautement disponibles et durables. Amazon S3 fournit une infrastructure durable pour stocker les données importantes et est conçu pour offrir une durabilité de 99,999999999 % des objets. Vos données sont stockées de manière redondante sur plusieurs installations et sur plusieurs appareils au sein de chaque installation.
Sécurisé
Amazon Athena vous permet de contrôler l'accès à vos données à l'aide de stratégies AWS Identity and Access Management (IAM), de listes de contrôle d'accès (ACL) et de stratégies de compartiment Amazon S3. A l'aide des stratégies IAM, vous pouvez accorder aux utilisateurs IAM un contrôle IAM précis de vos compartiments S3. En contrôlant l'accès aux données dans S3, vous pouvez empêcher les utilisateurs de les interroger à l'aide d'Athena. Athena vous permet de consulter facilement des données chiffrées stockées dans Amazon S3 et de réécrire les résultats chiffrés dans votre compartiment S3. Le chiffrement côté serveur et le chiffrement côté client sont tous les deux pris en charge.
Intégré
Amazon Athena s'intègre clé en main à AWS Glue. Grâce au catalogue de données Glue, vous serez en mesure de créer un référentiel de métadonnées unifié pour divers services, d'analyser des sources de données pour découvrir des schémas et alimenter votre catalogue de données avec des tables nouvelles ou mises à jour tout en partitionnant les données ainsi que de maintenir les versions de schéma. Vous pouvez également utiliser les capacités ETL entièrement gérées de Glue pour transformer les données ou les convertir sous forme de colonnes afin d'optimiser les performances des requêtes et réduire les coûts. En savoir plus sur AWS Glue.
Requête fédérée
Athena fournit des connecteurs pour les sources de données d’entreprise, notamment Amazon DynamoDB, Amazon Redshift, Amazon OpenSearch, MySQL, PostgreSQL, Redis et autres banques de données tierces populaires. Les connecteurs de données d'Athena vous permettent de générer des informations à partir de plusieurs sources de données grâce à la syntaxe SQL facile à utiliser d’Athena et sans avoir besoin de déplacer vos données avec des scripts ETL. Les connecteurs de données s’exécutent en tant que fonctions AWS Lambda et peuvent être activés pour permettre l’accès entre comptes, ce qui vous permet d’adapter les requêtes SQL à des centaines d’utilisateurs finaux. Pour connaître la liste des sources prises en charge, voir Utilisation des connecteurs de source de données Athena, et pour savoir comment créer un connecteur de source de données personnalisé, voir SDK du connecteur Athena.
Machine learning
Vous pouvez désormais appeler vos modèles de Machine Learning SageMaker dans une requête Athena SQL afin d'exécuter une inférence. La possibilité d’utiliser des modèles ML dans les requêtes SQL rend les tâches complexes, par exemple la détection des anomalies, l’analyse des cohortes de clients et les prévisions de ventes, aussi simples que l’écriture de la requête SQL. Grâce à Athena, toute personne possédant des connaissances dans le langage SQL pourra exécuter facilement ses modèles de machine learning déployés sur Amazon SageMaker.

Découvrez les différentes tarifications proposées pour Amazon Athena.

Commencez à créer avec Amazon Athena dans AWS Management Console.