发布于: Aug 20, 2019

您现在可以使用 EMR Notebooks 在运行时将外部 Python 库安装在 EMR 集群上。在此功能之前,您必须使用引导操作或使用自定义 AMI 在启动 EMR 集群前安装未随 AMI 打包的其他库。此功能允许您导入您的首选库并使用它们构建您的 Spark 应用程序、分析数据以及可视化笔记本内的结果。您使用 EMR Notebooks 安装的 Python 库独立于笔记本会话,将不会干扰 EMR 集群上的现有库。您可以从公共或私有 PyPI 存储库导入这些库。若要了解有关此功能的更多信息,请访问使用笔记本范围内的库

从 EMR 版本 5.26.0 开始提供此功能。

EMR Notebooks 已在美国东部(弗吉尼亚北部和俄亥俄)、美国西部(加利福尼亚北部和俄勒冈)、加拿大(中部)、欧洲(法兰克福、爱尔兰和伦敦)、亚太地区(孟买、首尔、新加坡、悉尼和东京)地区推出