发布于: Sep 24, 2021
Amazon SageMaker Studio 是首个适用于机器学习(ML)的完全集成式开发环境(IDE)。SageMaker Studio 提供基于 Web 的统一可视化界面,让您可以轻松执行准备数据以及构建、训练和部署模型所需的所有机器学习开发步骤。只需点击一下鼠标,数据科学家和 ML 开发人员即可快速启动 SageMaker Studio 笔记本,从而探索数据集和构建模型。现在,您可以使用生命周期配置来实现 Studio 开发环境的自动化自定义。
生命周期配置是由 SageMaker Studio 生命周期事件(启动新的 Studio 笔记本)触发的壳脚本。您可以使用脚本来实现 Studio 的自定义,例如安装自定义的软件包、配置笔记本扩展、预加载数据集以及设置源代码存储库等。通过将生命周期配置与为 SageMaker Studio 自带容器镜像的功能结合,可让您完全灵活地控制 Studio 的配置,从而满足您的具体需求。例如,您可以使用最常用的软件包和库创建少量的基本容器镜像,然后使用生命周期配置来安装额外的软件包,从而满足数据科学和机器学习(ML)团队的具体使用案例的需要。
生命周期配置功能现已在所有提供 Amazon SageMaker Studio 的 AWS 区域开放。您可以使用 AWS CLI 和 AWS SDK 创建生命周期配置并将其附加到您的 Studio 域或者具体的用户。您可以使用我们的示例脚本和示例快速入门。详细了解此新功能,请访问 SageMaker Studio 用户指南。