根据您的数据自动构建、训练和调整最佳 ML 模型,同时保持完全控制和可见性
根据模型性能和准确性要求从排行榜中选择最佳模型
只需单击即可将模型部署到生产环境,或使用 Amazon SageMaker Studio 中的推荐模型进行迭代
Amazon SageMaker Autopilot 消除了构建 ML 模型的繁重工作。您只需提供表格数据集并选择要预测的目标列,SageMaker Autopilot 将自动探索不同的解决方案以找到最佳模型。然后,只需单击操作,即可将模型直接部署到生产环境中,或通过迭代推荐的解决方案,进一步提高模型质量。
工作原理

主要功能
自动数据预处理和特征工程
即使缺少数据,您也可以使用 Amazon SageMaker Autopilot。 SageMaker Autopilot 会自动填充丢失的数据,提供有关数据集中各列的统计见解,并自动从非数字列中提取信息,例如时间戳中的日期和时间信息。
自动 ML 模型选择
Amazon SageMaker Autopilot 会自动推断最适合您的数据的预测类型,例如二进制分类、多分类或回归。然后,SageMaker Autopilot 探索高性能算法(例如梯度提升决策树、前馈深度神经网络和逻辑回归),并根据这些算法训练和优化数百种模型,以找到最适合您数据的模型。
模型排行榜
Amazon SageMaker Autopilot 允许您查看为数据自动生成的所有 ML 模型。您可以查看模型列表,按准确性、精确度、召回率和曲线下面积 (AUC) 等指标排名,查看模型详细信息(例如特征对预测的影响),并部署最适合您使用案例的模型。
功能重要性
Amazon SageMaker Autopilot 提供了 Amazon SageMaker Clarify 生成的可解释性报告,让您更容易理解和解释 SageMaker Autopilot 创建的模型是如何进行预测的。您还可以识别训练数据中的每个属性对预测结果的贡献百分比是多少。百分比越高,该特征对模型预测的影响就越大。
与您的应用程序轻松集成
您可以使用 Amazon SageMaker Autopilot 应用程序编程接口(API)轻松创建模型,并直接从您的应用程序(例如数据分析和数据仓库工具)推理。
可自定义的 AutoML 之旅
通过使用 Amazon SageMaker Autopilot,您可以自定义 AutoML 之旅的步骤,从而创建高质量的机器学习模型。您可以在 SageMaker Data Wrangler 中使用 300 多个预先配置的数据转换来应用自己的数据预处理和特征工程转换,并将方法步骤应用于 SageMaker Autopilot。您也可以为训练和验证数据定义一个自定义数据分割,或上传自定义数据集进行验证。此外,您可以选择训练特征、更改数据类型,以及为 SageMaker Autopilot 实验选择训练模式(集合或超参数优化)。
与您的应用程序轻松集成
您可以使用 Amazon SageMaker Autopilot 应用程序编程接口(API)轻松创建模型,并直接从您的应用程序(例如数据分析和数据仓库工具)推理。
自动创建笔记本
您可以为 Amazon SageMaker Autopilot 创建的任意模型自动生成 Amazon SageMaker Studio 笔记本,并深入了解其创建方式,根据需要对其进行细化,并在将来任何时候从笔记本中重新创建它。
使用案例
价格预测
价格预测模型普遍用于金融服务、房地产、能源和公用事业领域,以预测股票、房地产和自然资源的价格。Amazon SageMaker Autopilot 可以预测未来价格,帮助您根据历史数据(如需求、季节性趋势和其他商品的价格)做出合理的投资决策。
流失预测
客户流失是指损失客户,每家公司都在想方设法地消除这种状况。Amazon SageMaker Autopilot 自动生成的模型可帮助您了解流失模式。客户流失模型的工作方式是首先了解现有数据中的模式,然后识别新数据集中的模式,这样您就可以预测最有可能发生客户流失的情况。
风险评估
风险评估要求识别和分析可能对个人、资产和公司产生负面影响的潜在事件。由 Amazon SageMaker Autopilot 自动生成的模型可以预测新事件发生时的风险。风险评估模型使用您现有的数据集进行训练,因此您可以获得适用于您的业务的优化预测。
客户

“在 RetentionX,我们为电子商务公司提供一键式业务洞察力。为客户提供服务时,重要的是让他们能够快速启动并做出及时的业务决策,而构建准确的机器学习模型可能成本高昂,并需要几个月的试错。此外,模型准确性还高度依赖每位客户可获得的训练数据和特有功能集的广度和深度。借助 Amazon SageMaker Autopilot,客户可以自动根据特有的数据集生成最佳 ML 模型。得益于 SageMaker Autopilot,我们能够为成千上万的购买者提供个性化的洞察力,使其领略到 AutoML 的强大功能。”
RetentionX 首席执行官 Alexander Jost

“在 EPCVIP,我们利用机器学习来更好地了解用户组属性、加速处理,以及提高产品和服务的转换率。Fintech 是一个高度复杂的行业,总在不断变化。新的合作伙伴、附属公司、流量来源和产品服务每周都增加。在构建机器学习模型的同时,我们不断地进行试验,以调整模型,产生更好的结果。借助 Amazon SageMaker Autopilot,我们现在可以充分地利用数据来快速地制造原型和自动构建、训练及调整机器学习模型。通过 SageMaker Autopilot,我们可以为功能、超参数、算法和数据集编目录并进行审核,以便更全面地了解模型迭代。通过 SageMaker Autopilot 改进了匹配率和部署了其他模型,这一成果在我们公司的增益价值中占比达到 30%。”
EPCVIP 数据科学部门负责人 Pascal Simpkins

“Amazon SageMaker Autopilot 为 Sisense 的新 ML 服务提供支持,这正是我们在此新冠肺炎大流行期间在客户服务方面保持领先地位所需要的。Skullcandy 能够深入了解客户需求,改进我们的问题解决方案,并提高客户满意度。”
Skullcandy Inc. 首席信息官 Mark Hopkins

“以前,我们只是选择两个看起来相似的餐厅,但是现在我们对菜单项、客户和地点之间的关系有了真正的理解。支持 Domo 的新 ML 功能的 Amazon SageMaker Autopilot 一直是我们营销和采购团队尝试新想法并改善客户体验的助力器。”
Freddy's IT 总监 Sean Thompson

“人口统计映射的主要目标是从准确性和规模两个角度进行优化。尽管这通常很困难,但我们能够将 Amazon SageMaker Autopilot 与我们的全面培训数据和先进功能结合使用,以生成更好的模型,从而将我们的预测准确性提高 137%。”
Mobilewalla 公司 CEO Anindya Datta