Publié le: Jan 11, 2022
Amazon EMR Studio est un environnement de développement intégré (IDE) qui permet aux scientifiques et ingénieurs des données de facilement développer, visualiser et déboguer les applications de big data et d’analytique écrites en R, Python, Scala et PySpark. Aujourd’hui, nous sommes ravis de présenter SQL Explorer, une fonctionnalité de votre espace de travail EMR Studio qui vous autorise à parcourir le catalogue de données et d’exécuter des requêtes SQL sur les clusters EMR depuis EMR Studio. Cette version de SQL Explorer in EMR Studio prend en charge l’exécution de requêtes SQL sur Amazon EMR sur des clusters EC2 exécutant Presto version 0.254.1 ou supérieure.
Presto est un moteur de requêtes SQL rapide conçu pour les requêtes interactives d’analyticité sur de grands ensembles de données provenant de sources multiples. Dans l’explorateur SQL, vous pouvez vous connecter à Amazon EMR sur les clusters EC2 avec Presto installé pour voir et parcourir le catalogue de données. Les catalogues de données pris en charge comprennent le catalogue de données AWS Glue et le Metastore Hive auto-hébergé version 3.1.2 ou supérieure. SQL Explorer vous fournit également un éditeur pour exécuter des requêtes SQL, visualiser les résultats de la recherche dans un tableau et les télécharger en format csv. Vous avez également la possibilité d’exécuter plusieurs instructions SQL via différents onglets de l’éditeur. L’explorateur SQL est pris en charge par Amazon EMR versions 6.4.0+.
EMR Studio est disponible dans les régions suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Canada (Centre), Europe (Irlande), Europe (Francfort), Europe (Londres), Europe (Stockholm), Europe (Paris), Asie-Pacifique (Mumbai), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo) et Amérique du Sud (São Paulo).