亚马逊AWS官方博客

了解如何在 Amazon SageMaker Studio 中不停机更新笔记本实例类型

Amazon Web Services (AWS) 很高兴地宣布在 Amazon SageMaker Studio 中正式推出笔记本功能。Amazon SageMaker Studio 支持不停机更新机器学习 (ML) 实例类型、使用优化的 Amazon SageMaker 映像以及共享 Jupyter 笔记本。您可以将笔记本从在一种实例类型上切换为在另一种实例类型,并使用同一个笔记本内核(notebook kernel),例如从 ml.t3.medium 切换到 ml.p3.2xlarge,而无需中断工作或管理基础设施。从一个实例切换到另一个实例是无缝操作,您可以在实例启动时继续写代码。Amazon SageMaker Studio 域创建的时候会使用 Amazon Elastic File System (Amazon EFS),因此您的笔记本和数据将在新实例上立即可用。域中的每个用户都将在 EFS 卷上创建一个主目录,无需担心数据丢失。

在 Amazon SageMaker Studio 中使用笔记本

您可以通过 Amazon SageMaker Studio 访问笔记本,Amazon SageMaker Studio是首个基于 Web 的机器学习开发集成开发环境。一旦开始使用 Amazon SageMaker Studio,您就可以开始受益于不同实例类型的灵活性。

以下屏幕截图显示了两个并排的正在运行的笔记本。

左侧笔记本在 Data Science SageMaker 映像上(使用具有 2 个 vCPU 和 4 GiB 的实例)运行 Python 3 Jupyter 笔记本。右侧笔记本在具有 4 个 vCPU 和 16 GiB 内存的 GPU 实例上运行 PyTorch GPU 优化型 SageMaker 映像。这两个笔记本在不同的实例上运行,每个实例都可以消耗该实例的全部资源,而不会占用另一个实例资源,这使您能够在一个笔记本上自由地进行原型设计,同时在另一个实例上执行密集计算验证。

当您在 Amazon SageMaker Studio 中选择实例时(与选择笔记本内核的方式相同),将显示选择实例弹出框。

此对话框显示当前笔记本所使用的实例类型。同时显示支持快速启动的实例类型及其规格(vCPU,GPU以及内存),快速启动意味着这些实例可以在更短的时间提供服务。禁用仅显示快速启动将显示 Amazon SageMaker Studio 中支持的所有 ML 实例的列表。

当您为笔记本选择新的实例类型时,您会收到有关该更换过程正在进行的通知。

在更改实例时,您仍然可以编辑当前笔记本上的代码,但是在实例运行之前,无法执行代码单元格。但是,这仅适用于该处于更新状态的笔记本,Amazon SageMaker Studio的其他笔记本和其他功能均会继续可用,而不会出现中断。在前面的屏幕截图中,数据科学家正在使用拆分面板中的 Git 插件来查看对笔记本所做的某些更改。

Amazon SageMaker Studio 提供了适用于 TensorFlow、MXNet、PyTorch、TensorFlow 2、Data Science 和 Python 的预配置 Amazon SageMaker 映像。这些映像基于优化且预先打包的 AWS Deep Learning Containers。Data Science 映像适合最常见的数据科学工作流,包括热门的 Anaconda 发行版、AWS 命令行界面 (AWS CLI) 和 Amazon SageMaker Python 开发工具包。基础 Python 映像提供了最小的 Python 3 运行时,没有其他依赖项。

以下屏幕截图显示Amazon SageMaker Studio 的启动器页面,它允许您使用任何 Amazon SageMaker 映像创建笔记本、交互式 shell 或终端。在隔离环境中启动笔记本(内核)、shell 和终端的功能是 Amazon SageMaker Studio 的一项独特创新。

Amazon SageMaker Studio 允许您与同事无缝共享笔记本。您可以在 Studio 中为笔记本生成一个可共享的链接,而同事可以使用此链接将笔记本导入到他们的工作区中,以便查看或继续对其进行迭代。

以下屏幕截图显示正在运行的面板,它列出了正在运行的 Amazon SageMaker 映像。此面板还将显示哪些笔记本内核和终端正在哪些实例上运行。

您可以通过以下方式关闭映像:

  • 关闭给定实例上的所有映像,这样您的账户将停止为该实例支付更多费用
  • 关闭所有正在运行的映像以停止当前所有的收费
  • 关闭正在运行的映像将终止正在使用该映像的所有终端和笔记本内核

关闭正在运行的终端和笔记本内核不会对正在运行的映像产生影响。

如果您依次选择文件、关闭,则会显示关闭确认弹出框。选择全部关闭是终止所有正在运行的映像、内核、终端和 Jupyter 服务器的便捷方法。选择关闭服务器将仅关闭 Jupyter 服务器。重新启动服务器时,可通过此方法获取最新更新。

结论

Amazon SageMaker Studio 是适用于机器学习开发全流程的集成开发环境,它为基于笔记本开发的人员增加了新的强大功能。您可以在以下区域开始使用 Amazon SageMaker Studio:

  • 美国东部(俄亥俄)
  • 美国东部(弗吉尼亚北部)
  • 美国西部(俄勒冈)
  • 中国(北京)
  • 中国(宁夏)
  • 欧洲(爱尔兰)

要立即开始使用,请访问 Amazon SageMaker 控制台,或者查看文档以了解更多信息。请使用Amazon SageMaker Studio控制台右上角的反馈表、在 AWS 的 Amazon SageMaker 论坛上或通过常用的 AWS Support 联系人来提供反馈。
 

本篇作者

David Leen

是 Amazon SageMaker Studio 团队的高级软件工程师。他为 Amazon Comprehend、Amazon Translate 和 Amazon SageMaker 算法等 AWS 服务做出了贡献。他热衷于为科学家、ML 工程师和数据科学家构建工具。在加入 Amazon 之前,他在华盛顿大学攻读计算神经科学和应用数学博士学位。

Jaipreet Singh

是 Amazon SageMaker Studio 团队的高级软件工程师。 自 2017 年成立以来,他一直在 Amazon SageMaker 团队工作,并为 Jupyter 的各种开源项目做出了贡献。在闲暇时间,他喜欢前往 PNW 徒步旅行和滑雪。