发布于: Aug 31, 2020
EMR Notebooks 是一项服务,为编写临时作业和对其进行实验的数据科学家和工程师提供完全托管的基于 Jupyter 的笔记本。现在,您可以按非交互方式编排 EMR Notebooks,以运行 ETL 工作负载,尤其是在生产环境中。在此功能发布之前,执行笔记本需要通过 AWS 管理控制台访问 Jupyter 用户界面。
EMR Notebooks API 可使 AWS CLI 和开发工具包访问笔记本,因此您可以使用笔记本以自动方式运行 ETL 工作负载。您可以利用 AWS Step Functions 和 Apache Airflow 等编排服务构建弹性工作流,使用 cron 脚本以非交互方式按计划执行笔记本。您还可以将输入参数传递到笔记本中,并通过访问每个执行的历史输出来调试笔记本的所有执行。在此功能发布之前,对于每个新的输入值组合,您必须创建新的笔记本副本并对其进行修改。
要开始使用 EMR Notebooks,请访问 EMR Notebooks 页面。
此功能将在 EMR 版本 5.18.0 或更高版本中面向支持 EMR Notebooks 的区域提供。