Amazon SageMaker 笔记本

JupyterLab 中用于探索数据和构建机器学习模型的完全托管式笔记本

什么是 SageMaker 笔记本?

在几秒钟内即可从 Amazon SageMaker Studio 启动完全托管的 JupyterLab。使用笔记本、代码和数据的集成式开发环境(IDE)。您可以使用 IDE 中的可快速启动的协作式笔记本访问 SageMaker 和其他 AWS 服务中专门构建的机器学习工具,以完成机器学习开发,从使用 Spark on Amazon EMR 准备 PB 级数据,到训练和调试模型、部署和监控模型以及管理管道——这一切都在一个基于 Web 的可视界面中完成。轻松调高或调低计算资源,而不会中断您的工作。

SageMaker 笔记本的优势

只需几秒钟即可在 Amazon SageMaker Studio 中启动完全托管的 JupyterLab。SageMaker Studio 预先配置了 SageMaker Distribution,其中包含常用的机器学习软件包,包括 PyTorch、TensorFlow 和 Keras 等深度学习框架以及 NumPy、scikit-learn 和 panda 等常用的 Python 软件包。
利用云端的多种计算优化型实例和 GPU 加速实例,纵向扩展或横向扩展您的计算资源。
使用生成式人工智能驱动的编码配套服务和安全工具,更快地编写高质量的代码。使用 Amazon CodeWhisperer 生成、调试和解释源代码,并使用 Amazon CodeGuru 进行安全和代码质量扫描。
在同一个笔记本中构建统一的分析和机器学习工作流程。直接在笔记本上在 Amazon EMR 和 AWS Glue 无服务器基础设施上运行交互式 Spark 任务。使用内置 Spark 用户界面更快地监控和调试任务。只需几个简单步骤即可将笔记本安排为任务,就可以轻松实现数据准备自动化。

大规模构建 ML

快速入门

只需几秒钟即可在 Studio 中启动完全托管的 JupyterLab。SageMaker Studio 预先配置了预先构建的 SageMaker Distribution,其中包含常用的机器学习软件包,包括 PyTorch、TensorFlow 和 Keras 等深度学习框架;NumPy、scikit-learn 和 panda 等常用的 Python 软件包,可帮助您开始构建模型。

弹性计算

纵向扩展或横向扩展您的基础计算资源,并使用共享的持久性存储来切换计算,而无需中断您的工作。从 AWS 提供的最丰富的计算资源中进行选择,包括最强大的 GPU 机器学习实例。

提高 ML 开发效率

数据准备

利用统一的环境简化数据工作流。直接从 JupyterLab 创建、浏览和连接到 Amazon EMR 集群和 AWS Glue 交互式会话。使用内置的数据准备功能来可视化数据并提高数据质量。

笔记本作业

您可以使用 SageMaker 笔记本作业创建非交互式作业,使其按需运行或按计划运行。使用直观的用户界面或 SageMaker Python SDK 直接从 JupyterLab 安排作业。选择笔记本后,SageMaker 笔记本会创建整个笔记本的快照,并将其依赖项打包到容器中,构建基础设施,将笔记本作为自动化作业按从业者设置的日程运行,并在作业完成后取消预置基础设施。SageMaker 笔记本作业也可作为 Amazon SageMaker Pipelines 中的原生步骤使用,使您能够在几行代码内将笔记本自动转换为多步骤工作流,并依赖于 CI/CD 部署。

人工智能驱动的工具

Amazon CodeWhisperer 是一款人工智能编码配套服务,可生成实时代码建议。有了 CodeWhisperer,你可以用自然语言编写注释,概述特定任务,例如“使用 CSV 文件创建一个 pandas 数据框架”,CodeWhisperer 会直接在笔记本中推荐一个或多个可以完成任务的代码片段。Amazon CodeGuru 安全防御工具可帮助笔记本用户检测安全漏洞,例如笔记本单元中的注入缺陷、数据泄漏、弱密码或加密缺失。当发现漏洞或质量问题时,CodeGuru 会生成建议,以根据 AWS 安全最佳实践修复这些问题。

灵活性和自定义

专为团队而构建

使用 AWS IAM Identity Center(AWS Single Sign-on 的后继者),设置您的团队对 SageMaker Studio 笔记本的访问权限。为平台管理员和业务领导创建单独的环境,以监控 SageMaker Studio 的成本和使用情况。创建共享的空间,以使您的团队能够共同实时读取、编辑和运行笔记本,以简化协作和沟通。团队成员可以共同审查结果,以便立即了解模型的运行情况,而不必来回传递信息。使用为 BitBucket 和 AWS CodeCommit 等服务提供的内置支持,团队可以轻松管理不同的笔记本版本,并比较随时间发生的变化。系统会自动标记所有的资源,因此便于使用 AWS Budgets 和 AWS Cost Explorer 成本管理服务等工具监控成本和制定预算计划。

可自定义

使用一个自定义的 Docker 映像,将您自己的笔记本开发环境迁移到 SageMaker Studio。使用“生命周期配置”,为您的团队自动化和自定义笔记本环境。

独立笔记本实例

在完全托管式 SageMaker 服务中,使用您熟悉并信赖的独立版 Jupyter 笔记本。免去很多麻烦,包括设置计算资源、升级数据科学和机器学习软件包以及应用安全补丁。使用 SageMaker 笔记本实例,您可以将全部精力放在机器学习上,并使用最新的开源软件保护和及时更新您的计算环境。