Publié le: Nov 30, 2022

Amazon Athena prend désormais en charge Apache Spark, un système populaire de traitement distribué à code open source, optimisé pour les charges de travail analytiques rapides sur des données de toute taille. Athena est un service de requêtes interactif qui vous aide à interroger des pétaoctets de données où qu'elles se trouvent, que ce soit dans des lacs de données, dans des bases de données ou dans d'autres magasins de données. Avec Amazon Athena pour Apache Spark, vous profitez de l'expérience rationalisée, interactive et sans serveur d'Athena avec Spark en plus de SQL.

Vous pouvez créer des applications Apache PySpark interactives en utilisant une expérience de blocs-notes simplifiée dans la console Athena ou par le biais d'API Athena. Avec Athena, les applications Spark interactives démarrent en moins d'une seconde et s'exécutent plus rapidement grâce à notre environnement Spark optimisé, afin que vous puissiez consacrer plus de temps aux résultats plutôt qu'à les attendre. Comme Athena s'occupe de gérer l'infrastructure et de configurer les paramètres Spark, vous pouvez vous concentrer sur vos applications métier.

Vous pouvez utiliser Athena pour Apache Spark dans les cinq Régions AWS suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Asie-Pacifique (Tokyo) et Europe (Irlande). Ce service sera étendu à d'autres régions dans les mois à venir.

Pour en savoir plus et vous lancer, consultez la page web Amazon Athena pour Apache Spark.