Amazon SageMaker Autopilot

自动创建机器学习模型并保持完全可见性

Amazon SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型,同时允许您保持完全控制和可见性。

建立机器学习 (ML) 模型要求您手动准备各项功能、测试多种算法并优化数百个模型参数,以便为您的数据找到最佳模型。但是,这种方法需要深厚的 ML 专业知识。如果您不具备这些专业知识,则可以使用自动方法 (AutoML),但是通过 AutoML 方法通常几乎无法看到功能对模型预测的影响。因此,您对它的信任度可能会降低,因为您无法重新创建它,也无法了解它如何做出预测。

Amazon SageMaker Autopilot 消除了构建 ML 模型的繁重工作,并帮助您根据数据自动构建、训练和调优最佳 ML 模型。使用 SageMaker Autopilot,您只需提供一个表格数据集并选择要预测的目标列,可以是数字(如房价,称为回归)或类别(如垃圾邮件/非垃圾邮件,称为分类)。SageMaker Autopilot 将自动探索不同的解决方案以找到最佳模型。然后,只需单击一下,即可将模型直接部署到生产环境中,或使用 Amazon SageMaker Studio 迭代推荐的解决方案,以进一步提高模型质量。

工作原理

工作原理 – Autopilot

优势

快速生成高质量模型

Amazon SageMaker Autopilot 通过优化数百个 ML 模型和参数,自动为您的数据识别最佳 ML 模型。经过一组初始迭代后,SageMaker Autopilot 会在 SageMaker Studio 中创建一个按性能排序的模型排行榜。您可以查看每个模型使用哪些数据功能,并部署您认为最适合您的使用案例的功能。

一键式部署

Amazon SageMaker Autopilot 根据您的数据自动构建、训练和调优最佳 ML 模型后,您只需单击即可轻松将模型部署到生产中。您可以通过使用 REST API 调用查询模型终端节点来开始预测。您还可以使用 Amazon SageMaker 模型监控器监控部署的模型。

保持可见性和控制

生成模型完全透明。您可以为 Amazon SageMaker Autopilot 创建的任何模型自动生成 Amazon SageMaker Studio Notebook。然后,您可以深入了解其创建方法的详细信息,根据需要对其进行优化,并在将来的任何时候从 Notebook 重新创建它。

多层安全性

Amazon SageMaker 提供了一套全面的安全功能,包括加密、专用网络连接、授权、身份验证、监控和可审核性,使您的组织可以满足机器学习工作负载的严格安全要求。

主要功能

自动数据预处理和特征工程

即使缺少数据,您也可以使用 Amazon SageMaker Autopilot。 SageMaker Autopilot 会自动填充丢失的数据,提供有关数据集中各列的统计见解,并自动从非数字列中提取信息,例如时间戳中的日期和时间信息。

自动 ML 模型选择

Amazon SageMaker Autopilot 会自动推断最适合您的数据的预测类型,例如二进制分类、多分类或回归。然后,SageMaker Autopilot 探索高性能算法,例如梯度提升决策树、前馈深度神经网络和逻辑回归,并根据这些算法训练和优化数百种模型,以找到最适合您数据的模型。

模型排行榜

Amazon SageMaker Autopilot 允许您查看为数据自动生成的所有 ML 模型。您可以查看模型列表,按准确性、精确度、召回率和曲线下面积 (AUC) 等指标排名,查看模型详细信息(例如特征对预测的影响),并部署最适合您使用案例的模型。

自动创建笔记本

您可以为 Amazon SageMaker Autopilot 创建的任意模型自动生成 Amazon SageMaker Studio 笔记本,并深入了解其创建方式,根据需要对其进行细化,并在将来任何时候从笔记本中重新创建它。

与您的应用程序轻松集成

您可以使用 Amazon SageMaker Autopilot 应用程序编程接口 (API) 轻松创建模型,并直接从您的应用程序(例如数据分析和数据仓库工具)推理。

Amazon SageMaker Autopilot Model Leaderboard
Amazon SageMaker Autopilot Automatic Notebook Creation
Amazon SageMaker Autopilot Automatic Data-preprocessing and Feature Engineering
Amazon SageMaker Autopilot Automatic Model Selection

使用案例

价格预测

价格预测模型普遍用于金融服务、房地产、能源和公用事业领域,以预测股票、房地产和自然资源的价格。 Amazon SageMaker Autopilot 可以预测未来价格,帮助您根据历史数据(如需求、季节性趋势和其他商品的价格)做出合理的投资决策。

流失预测

客户流失是指损失客户,每家公司都在想方设法地消除这种状况。Amazon SageMaker Autopilot 自动生成的模型可帮助您了解流失模式。客户流失模型的工作方式是首先了解现有数据中的模式,然后识别新数据集中的模式,这样您就可以预测最有可能发生客户流失的情况。

风险评估

风险评估要求识别和分析可能对个人、资产和公司产生负面影响的潜在事件。由 Amazon SageMaker Autopilot 自动生成的模型可以预测新事件发生时的风险。风险评估模型使用您现有的数据集进行训练,因此您可以获得针对您的业务的优化预测。

客户

Freddys
“以前,我们只是选择两个看起来相似的餐厅,但是现在我们对菜单项、客户和地点之间的关系有了真正的理解。支持 Domo 的新 ML 功能的 Amazon SageMaker Autopilot 一直是我们营销和采购团队尝试新想法并改善客户体验的助力器。”

Freddy's IT 总监 Sean Thompson

Skullcandy
“Amazon SageMaker Autopilot 为 Sisense 的新 ML 服务提供支持,这正是我们在此新冠肺炎大流行期间保持客户服务领先地位所需要的。Skullcandy 能够深入了解客户需求,改进我们的问题解决方案,并提高客户满意度。”

Skullcandy Inc. 首席信息官 Mark Hopkins

mobilewalla
“人口统计映射的主要目标是在准确性和规模上进行优化。尽管这通常很困难,但我们能够将 Amazon SageMaker Autopilot 与我们的全面培训数据和先进功能结合使用,以生成更好的模型,从而将我们的预测准确性提高 137%。”

Mobilewalla 公司 CEO Anindya Datta

Amazon SageMaker Autopilot 入门