发布于: Jan 11, 2022
Amazon EMR Studio是一个集成开发环境 (IDE),使数据科学家和数据工程师能够轻松地开发、可视化和调试用 R、Python、Scala 和 PySpark 编写的大数据和分析应用程序。今天,我们很高兴推出 SQL Explorer,这是 EMR Studio Workspace 中的一项功能,允许您从 EMR Studio 浏览数据目录并在 EMR 集群上运行 SQL 查询。EMR Studio 中此版本的 SQL Explorer 支持在运行 Presto 版本 0.254.1 或更高版本的 EC2 集群上的 Amazon EMR 上运行 SQL 查询。
Presto是一个快速 SQL 查询引擎,用于对来自多个源的大型数据集进行交互式分析查询。在 SQL explorer 中,您可以连接到安装了 Presto 的 EC2 集群上的 Amazon EMR,以查看和浏览数据目录。支持的数据目录包括 AWS Glue 数据目录和自托管的 Hive Metastore 版本 3.1.2 或更高版本。SQL Explorer 还为您提供了一个编辑器,用于运行 SQL 查询、在表中查看查询结果以及下载 csv 格式的查询结果。您还可以通过不同的编辑器选项卡运行多个 SQL 语句。Amazon EMR 版本 6.4.0+ 支持 SQL Explorer。
EMR Studio 现已向以下区域推出:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、欧洲(爱尔兰)、欧洲(法兰克福)、欧洲(伦敦)、欧洲(斯德哥尔摩)、欧洲(巴黎)、亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(东京)和南美洲(圣保罗)。