发布于: Nov 19, 2018
今日,我们宣布 EMR Notebooks 公开发布,这是基于 Jupyter Notebooks 开发的一个托管环境,支持数据科学家、分析师和开发人员进行数据的准备和可视化处理,与同行协作,构建应用程序,并使用 EMR 集群执行交互式分析。
EMR Notebooks 已针对 Spark 进行了预先配置,支持 Spark 魔力内核,允许您在通过 PySpark、Spark SQL、Spark R 和 Scala 等语言编写的 EMR 集群上,交互式运行 Spark 作业。这类笔记本已与 Conda 中的开源库配套,支持您导入并利用开源库来处理数据,然后通过丰富的图形来显示计算结果。此外,每个笔记本都集成了 Spark 监控功能,支持您直接通过笔记本来监控作业进度和调试代码。
您可以直接通过控制台创建多个笔记本。没有软件或实例需要管理,笔记本会立即启动,您可选择将笔记本连接到现有集群,也可直接通过控制台配置新集群。您可将多台笔记本附加到单一集群,也可分离笔记本并重新附加到新的集群。
EMR Notebooks 会定期将您的笔记本文件保存到 Amazon S3 存储桶中。已保存的笔记本可通过 EMR 控制台进行检索,也可通过 S3 存储桶进行下载。
如需了解详细信息,请访问 EMR Notebooks 页面。
使用 EMR Notebooks 无需支付额外费用,只需支付将 EMR 集群附加至笔记本的费用。如需了解有关集群定价的更多信息,请访问 Amazon EMR 定价。
EMR Notebooks 已在美国东部(弗吉尼亚北部和俄亥俄)、美国西部(加利福尼亚北部和俄勒冈)、加拿大(中部)、欧洲(法兰克福、爱尔兰和伦敦)、亚太地区(孟买、首尔、新加坡、悉尼和东京)地区推出。