[SEO 副标题]
本指引将展示如何将您自己的机器学习(ML)模型引入到 Amazon SageMaker Canvas 中,并且避免在新环境中构建或移动机器学习模型时经常需要执行的手动代码更改。在本指引中,我们将展示三种模式,以说明您的团队如何将机器学习模型与 SageMaker Canvas 结合使用。第一种模式,您可以在 SageMaker 模型注册表中注册机器学习模型,此注册表是机器学习模型的元数据存储库。第二种模式,您可以直接共享使用 Amazon SageMaker Autopilot 构建的模型。第三种模式,您可以使用 Amazon SageMaker Jumpstart 将机器学习模型导入到 SageMaker Canvas 中。随后,业务分析师无需编写任何代码,即可在 Canvas 中分析任何模型并从中生成预测。
请注意:[免责声明]
架构图

Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
SageMaker Studio、SageMaker Canvas、SageMaker Data Wrangler 和 SageMaker JumpStart 是专门构建的完全托管式机器学习服务,可以与很多 AWS 原生服务集成。这些服务可以帮助您自动执行持续集成和持续交付(CI/CD)以及机器学习操作(MLOps)管道,因此提高了开发人员的工作效率。
具体而言,SageMaker Studio 是一个 IDE,它提供了基于 Web 的单一可视化界面,您可以从此界面访问专门构建的工具,以执行所有机器学习开发步骤。从准备数据到构建、训练和部署机器学习模型,这些步骤可以将团队的工作效率提高多达 10 倍。此外,借助 SageMaker Data Wrangler,您无需编写任何代码,即可使用 300 多种内置的数据转换来准备和转换数据集。此外,SageMaker Canvas(它的功能是从 SageMaker Autopilot 转移而来的)可以使用更新后的数据集重新训练和部署模型。此外,SageMaker JumpStart 为多种问题类型提供了预训练的开源模型,以帮助您开始使用机器学习。最后,使用 SageMaker Studio,您可以通过这三种模式中的任一种共享经过训练的模型。
-
安全性
要部署本指引,您必须设置对服务具有适当权限的 AWS Identity and Access Management(IAM)用户或角色。随后,使用 IAM 加入 Amazon SageMaker Domain,并添加和移除用户配置文件。Amazon S3 自动允许上传新对象或者使用 Amazon S3 管理的密钥进行服务器端加密(SSE-S3)。不过,您也可以选择配置存储桶,以使用 AWS Key Management Service(AWS KMS)密钥进行服务器端加密(SSE-KMS)。要获得更多信息,使用 AWS KMS 进行服务器端加密(SSE-KMS)会有所帮助。
这些服务可以帮助您安全地控制和设置用户(例如机器学习团队、开发人员和数据科学家)对 AWS 资源的访问权限。使用 IAM,您可以生成和下载凭证报告,其中将会列出您账户中的所有用户。您还可以使用此报告审核凭证生命周期要求的影响,例如密码和对密钥轮换的访问权限。
-
可靠性
Amazon SageMaker 对托管的模型进行自动扩展,以帮助您与 AWS 最佳可靠性实践保持一致。
要监控数据和模型质量,您可以使用 CloudWatch 或 SageMaker Model Monitor 设置警报,并在达到这些阈值时发送通知或采取行动。
此外,SageMaker 端点是专为机器学习构建的;它是一项完全托管式服务,可以与 CloudWatch 和 SageMaker Model Monitor 集成。这些服务可以帮助您监控机器学习端点和 API,使您能够配置警报、采取行动以及在没有任何流量时将资源缩减到零。
最后,将训练数据存储在 Amazon S3 中,这是一项存储服务,可提供高达 99.999999999%(11 个 9)的持久性。
-
性能效率
SageMaker Canvas(具有来自 SageMaker Autopilot 的功能)有助于确保您的工作负载高效地运行;使用这项机器学习服务,您可以执行多个作业和试验。它具有可解释性等功能,可以帮助您更好地了解模型。SageMaker 可以将 AutoML 作业与三个基于笔记本的报告结合使用,以管理自动机器学习(AutoML)任务,还可以根据需要编辑这些笔记本。
使用 SageMaker Jumpstart,您可以选择正确的实例类型并配置自动扩展。SageMaker 还为训练和推理提供了专门构建的加速器,例如 AWS Inferentia 和 AWS Trainium 芯片。对于模型训练,可以通过 SageMaker Python 软件开发套件中的 TrainingInput 类的分配参数进行扩展,使用此工具包,您可以指定如何在用于训练作业的多个训练实例之间分配数据。分配参数具有三个选项:FullyReplicated、ShardedByS3Key 和 ShardedByRecord。 SageMaker 还支持自动扩缩托管的模型。
-
成本优化
使用完全托管式和专门构建的机器学习 SageMaker 服务,您只需为所需的资源付费,因此有助于优化成本,并避免预置不足或过度预置的情况。如果您当前没有使用 SageMaker Canvas,可以注销会话并关闭资源。此外,与按需型实例相比,托管型 Spot 训练进一步优化了模型训练成本,最多可节省 90%。托管型 Spot 训练使用 Amazon Elastic Compute Cloud(Amazon EC2)竞价型实例(而不是按需型实例)来执行训练作业。要运行试验、测试和开发这几种工作负载,您可以选择按需定价模式和 Spot 定价模式。对于稳态工作负载,本指引中使用的完全托管式服务允许您利用节省计划购买更灵活的定价模式。
-
可持续性
本指引采用的配置始终使用高利用率的资源。它利用专门构建和托管的服务自动扩展资源,并确保高效地使用资源。此外,它还使用 SageMaker Model Monitor,此监控器可以帮助您捕获输入、输出和元数据,以调用您部署的模型。它还可以帮助您分析数据和监控数据质量。
您可以使用 SageMaker Model Monitor 自动执行模型偏差检测,并只在必要时进行重新训练,这意味着优化了对环境的影响(尤其是后端的能耗和效率),从而确保高效地使用资源。
实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段(包括部署、使用和清理)都将被检查,以便为部署做好准备。
示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。