发布于: Nov 2, 2022

对大于 100MB 且运行 100 或更多次试验的数据集,使用超参数训练的 Amazon SageMaker Autopilot 实验生成机器学习模型的速度提高多达 2 倍。Amazon SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型,同时允许您保持完全控制和可见性。 

SageMaker Autopilot 提供两种训练模式 - 超参数优化 (HPO) 和集成。在 HPO 模式下,SageMaker Autopilot 选择与您的数据集最相关的算法,并选择最佳超参数范围以使用贝叶斯优化调整模型。但是,对于较大的数据集 (> 100MB),使用贝叶斯优化进行调整的时间可能较长。即日起,SageMaker Autopilot 将使用一种新的多保真度超参数优化 (HPO) 策略,该策略对大于 100MB 且运行 100 次或更多次试验的数据集使用最先进的 Hyperband 调优算法,同时继续对小于 100MB 的数据集使用贝叶斯优化策略。通过多保真度优化策略,根据选定的客观指标会提前停止性能不佳的试验,从而为性能良好的试验释放资源。这样反过来会减少 HPO 训练模式 SageMaker Autopilot 试验对大型数据集的调整时间。 

通过此版本,模型训练和调整速度会提高多达 2 倍,使客户可以更快地提供性能最佳的机器学习模型。为了评估性能提升幅度,我们使用了多个 OpenML 基准数据集,大小从 100MB 到 10GB 不等。根据我们的结果,中等大小的数据集 (100MB - 1GB) 运行时性能提高 41%(从平均 345 分钟缩短到 203 分钟),超大的数据集 (> 1GB) 运行时性能提高 48%(从平均 2010 分钟缩短到 1053 分钟)。由于此增强功能,您可以更快地运行 SageMaker Autopilot 试验,而无需对现有任务配置进行任何更改。

有关更多信息,请参阅文档,要了解有关 SageMaker Autopilot 的更多信息,请访问产品页面