发布于: May 10, 2023
Amazon SageMaker Autopilot 是一项低代码机器学习 (ML) 服务,可自动构建、训练和优化最佳机器学习模型,现已支持在集成模式下使用加权目标指标进行训练,还支持其他八个目标指标。为训练数据集中的每个数据样本分配权重可以帮助模型更好地学习、减少对特定类别的偏差并提高稳定性,从而提高模型的整体效果。
使用不平衡的数据集进行训练时,某些类别的数据样本明显少于其他类别,为这些类别分配更高的权重可以帮助模型更好地学习并减少对大多数类别的偏差。自即日起,您可以在创建 Autopilot 实验时在输入数据集中传递权重列名称。SageMaker Autopilot 将使用这些权重值来进一步了解您的数据集,并在训练机器学习模型时应用了解到的信息。
SageMaker Autopilot 现在还支持其他八个目标指标,例如 RMSE、MAE、R2、平衡准确率、查准率、查准率宏、查全率和查全率宏(记录在此处)。所选的目标指标在训练期间经过优化,以便从数据中为模型参数值提供最佳估计值。如果您未明确指定指标,则默认行为是自动使用 MSE 进行回归,使用 F1 进行二进制分类,使用准确率进行多类别分类。
要开始使用,请在 SageMaker Studio 控制台中创建 SageMaker Autopilot 实验。升级到最新版本的 SageMaker Studio 即可使用新的样本权重列功能和其他一组目标指标。要了解更多信息,请参阅开发人员指南和产品页面。