Amazon SageMaker 笔记本

JupyterLab 中用于探索数据和构建机器学习模型的完全托管式笔记本

什么是 SageMaker 笔记本?

在几秒钟内即可从 Amazon SageMaker Studio 启动完全托管的 JupyterLab。使用笔记本、代码和数据的集成式开发环境(IDE)。您可以使用 IDE 中的可快速启动的协作式笔记本访问 SageMaker 和其他 AWS 服务中专门构建的机器学习工具,以完成机器学习开发,从使用 Spark on Amazon EMR 准备 PB 级数据,到训练和调试模型、部署和监控模型以及管理管道——这一切都在一个基于 Web 的可视界面中完成。轻松调高或调低计算资源,而不会中断您的工作。

SageMaker 笔记本的优势

只需几秒钟即可在 Amazon SageMaker Studio 中启动完全托管的 JupyterLab。SageMaker Studio 预先配置了 SageMaker Distribution,其中包含常用的机器学习软件包,包括 PyTorch、TensorFlow 和 Keras 等深度学习框架以及 NumPy、scikit-learn 和 panda 等常用的 Python 软件包。
利用云端的多种计算优化型实例和 GPU 加速实例,纵向扩展或横向扩展您的计算资源。
使用生成式人工智能驱动的编码配套服务和安全工具,更快地编写高质量的代码。使用 Amazon CodeWhisperer 生成、调试和解释源代码,并使用 Amazon CodeGuru 进行安全和代码质量扫描。
在同一个笔记本中构建统一的分析和机器学习工作流程。直接在笔记本上在 Amazon EMR 和 AWS Glue 无服务器基础设施上运行交互式 Spark 任务。使用内置 Spark 用户界面更快地监控和调试任务。只需几个简单步骤即可将笔记本安排为任务,就可以轻松实现数据准备自动化。

大规模构建 ML

快速入门

只需几秒钟即可在 Studio 中启动完全托管的 JupyterLab。SageMaker Studio 预先配置了预先构建的 SageMaker Distribution,其中包含常用的机器学习软件包,包括 PyTorch、TensorFlow 和 Keras 等深度学习框架;NumPy、scikit-learn 和 panda 等常用的 Python 软件包,可帮助您开始构建模型。

弹性计算

纵向扩展或横向扩展您的基础计算资源,并使用共享的持久性存储来切换计算,而无需中断您的工作。从 AWS 提供的最丰富的计算资源中进行选择,包括最强大的 GPU 机器学习实例。

提高 ML 开发效率

数据准备

利用统一的环境简化数据工作流。直接从 JupyterLab 创建、浏览和连接到 Amazon EMR 集群和 AWS Glue 交互式会话。使用内置的数据准备功能来可视化数据并提高数据质量。

笔记本作业

您可以使用 SageMaker 笔记本作业创建非交互式作业,使其按需运行或按计划运行。使用直观的用户界面或 SageMaker Python SDK 直接从 JupyterLab 安排作业。选择笔记本后,SageMaker 笔记本会创建整个笔记本的快照,并将其依赖项打包到容器中,构建基础设施,将笔记本作为自动化作业按从业者设置的日程运行,并在作业完成后取消预置基础设施。SageMaker 笔记本作业也可作为 Amazon SageMaker Pipelines 中的原生步骤使用,使您能够在几行代码内将笔记本自动转换为多步骤工作流,并依赖于 CI/CD 部署。

人工智能驱动的工具

Amazon CodeWhisperer 是一款人工智能编码配套服务,可生成实时代码建议。有了 CodeWhisperer,你可以用自然语言编写注释,概述特定任务,例如“使用 CSV 文件创建一个 pandas 数据框架”,CodeWhisperer 会直接在笔记本中推荐一个或多个可以完成任务的代码片段。Amazon CodeGuru 安全防御工具可帮助笔记本用户检测安全漏洞,例如笔记本单元中的注入缺陷、数据泄漏、弱密码或加密缺失。当发现漏洞或质量问题时,CodeGuru 会生成建议,以根据 AWS 安全最佳实践修复这些问题。