发布于: Sep 22, 2021

EMR Studio 是一个集成开发环境 (IDE),使数据科学家和数据工程师能够轻松地开发、可视化和调试用 R、Python、Scala 和 PySpark 编写的大数据和分析应用程序。今天,我们很高兴地宣布,从 EMR 6.4.0 及更高版本开始,您可以在 EMR Studio 的同一个 Jupyter 笔记本中使用 Python、Scala、SparkSQL 和 R,从而灵活地使用不同的编程语言处理 Spark 工作负载。

以前,您只能在同一个笔记本中以一种语言编写代码来处理 Spark 工作负载。现在,通过 Jupyter 笔记本的这一功能增强,您可以在同一个 Jupyter 笔记本中在 Python、Scala、SparkSQL 和 R 之间进行切换,并通过临时表在单元格之间共享数据。您还可以从 EMR Notebooks 或与 EMR 6.4.0 及更高版本的 Jupyter Enterprise Gateway (JEG) 通信的 Jupyter 笔记本使用此功能。

EMR Studio 现已向以下区域推出:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、加拿大(中部)、欧洲(爱尔兰)、欧洲(法兰克福)、欧洲(伦敦)、欧洲(斯德哥尔摩)、亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)和亚太地区(东京)。

要了解有关在 EMR Studio 的同一个 Jupyter 笔记本中使用多种语言的更多信息,请在此处参阅我们的文档。