概览
Amazon SageMaker Canvas 通过为业务分析师提供直观界面来扩展对机器学习 (ML) 的访问,使他们能够自行生成准确的 ML 预测,而无需任何 ML 经验或编写任何代码。借助 SageMaker Canvas,您可以在几分钟内访问即用型模型或创建自定义模型,从成千上万的文档、图像和文本行中提取信息并生成预测。要开始使用即用型模型,只需选择一个此类模型,上传数据,然后单击生成预测即可。您还可以为分类、回归、预测、文本分类或图像分类构建自己的自定义模型。您可以导入不同的云端和本地数据来源,分析、探索和可视化特征之间的关系,甚至可以使用函数和运算符创建新特征。然后,SageMaker Canvas 让您只需单击几下即可创建 ML 模型并生成准确的预测。您还可以发布结果、解释和解读模型。此外,您还可以与组织内的数据科学家协作。您可以共享模型以供审查和更新,数据科学家可以共享在其他工具中构建的 ML 模型,因此您可以直接在 SageMaker Canvas 中生成对这些模型的预测。
基础模型
Amazon SageMaker Canvas 支持即用型基础模型(FM),以便业务分析师可以通过无代码界面提高工作效率并加速生成式人工智能的使用。您可以使用基础模型生成和汇总内容。
您可以通过无代码聊天界面访问 Claude 2、Amazon Titan 和 Jurassic-2(由 Amazon Bedrock 提供支持)等基础模型以及 Falcon 和 MPT(由 SageMaker JumpStart 提供支持)等公共模型。您还可以轻松地并排比较 FM 的响应,并选择最适合您的需求的响应。
即用型自然语言处理(NLP)和计算机视觉(CV)模型
要快速生成机器学习预测,您可以访问适用于各种自然语言处理和计算机视觉用例的即用型模型。即用型模型包括情感分析、图像中的物体检测、图像中的文本检测、实体提取、语言检测、个人信息检测、费用分析、识别文件分析和文档分析。此外,即用型模型不需要构建模型,由包括 Amazon Rekognition、Amazon Textract 和 Amazon Comprehend 在内的 AWS AI 服务提供支持。首先,您可以带上文本、图像或文档等数据,然后选择一个即用型模型,只需单击一下即可生成预测。
创建自定义模型
借助 Amazon SageMaker Canvas,您还可以创建使用自己的数据进行训练的自定义分类、回归、预测、文本分类或图像分类模型。SageMaker Canvas 提供一个可视化点击式界面,用于连接、准备、分析和探索数据,以构建 ML 模型并生成预测。
浏览、导入和联接数据
您可以使用 SageMaker Canvas 可视化界面浏览和导入数据。SageMaker Canvas 支持 CSV、JPEG 和 PNG 文件类型,并且能够发现您的账户有权访问的 AWS 数据来源,包括 Amazon Simple Storage Service (S3)、Amazon Athena (Glue Data Catalog) 和 Amazon Redshift。您也可以从本地磁盘拖放文件或从 40 多个第三方数据来源(如 SAP OData、Salesforce 和 Snowflake)导入数据。此外,您还可以使用连接操作来连接多个来源的数据,并为训练预测模型创建新的统一数据集。例如,您可以将 Salesforce 中包含客户 ID 的交易数据与 Amazon S3 中包含客户资料数据的 CSV 表联接起来,从而创建新的数据集。然后,您可以验证数据是否正确导入,使用均值和中位数等参数了解数据分布,并确定数据中是否存在缺失值。您还可以分析数据并识别数据集中列之间的相关性。SageMaker Canvas 还支持自动和手动更新数据集(本地上传和 Amazon S3 数据来源),因此您可以使用最新版本的表格、图像和文档数据集来训练 ML 模型。
内置探索性数据分析和可视化
SageMaker Canvas 提供探索性数据分析(EDA),使您能够准备、探索和分析您的数据。您可以估算缺失值并用自定义值替换异常值,可视化特征之间的关系,并使用函数和运算符创建新特征。
自动创建模型
连接数据来源、选择数据集并准备好数据后,您就可以选择要预测的特征并启动模型创建作业。SageMaker Canvas 将识别问题类型,生成新的相关特征,根据问题类型(使用例如线性回归、逻辑回归、深度学习、时间序列预测和梯度提升等 ML 技术)测试数百种预测模型,并创建基于您的数据集进行最准确预测的模型。您可以与 Amazon QuickSight 共享模型预测,以构建在同一交互式视觉效果中结合传统商业智能和预测数据的控制面板。此外,SageMaker Canvas 模型可以直接在 QuickSight 中共享和集成,使分析师能够在 QuickSight 仪表板中为新数据生成高度准确的预测。
生成 ML 预测
您可以使用在 SageMaker Canvas 中创建的自定义模型来生成单个或批量机器学习预测。使用 SageMaker Canvas,您可以设置自动批量预测工作流程并将数据集与其关联。当手动或按计划更新关联数据集时,将在相应模型上自动触发批量预测工作流程。然后,您可以在线查看预测结果或下载以供查看。
内置式协作
SageMaker Canvas 能够简化与数据科学家的协作。您可以与使用 SageMaker Studio 的数据科学家共享您的 SageMaker Canvas 模型。他们可以审查、更新并与您共享更新后的模型,因此您可以在 SageMaker Canvas 中分析更新后的模型并生成预测。
自带 ML 模型
在 SageMaker 模型注册表中注册后,数据科学家就可以共享在其他工具中构建的任何 ML 模型,从而使您可以在 SageMaker Canvas 中生成对这些模型的预测。数据科学家还可以共享 SageMaker Autopilot 模型和来自 SageMaker JumpStart 的训练模型,这样您就可以对数据科学家构建的模型生成高度准确的预测。
在生产环境中操作 ML 模型
只需单击一下即可将在 Amazon SageMaker Canvas 中创建的机器学习模型注册到 SageMaker 模型注册表,这样您就可以将机器学习模型投入生产。在 SageMaker Canvas 中创建模型以运行假设分析并生成单个或批量预测后,您可以将该模型注册到 SageMaker 模型注册表并将其集成到现有的模型部署 CI/CD 流程中。