Amazon SageMaker Autopilot 实验在超参数优化训练模式下速度现已提高多达 2 倍

发布于: Nov 2, 2022

对大于 100MB 且运行 100 或更多次试验的数据集，使用超参数训练的 Amazon SageMaker Autopilot 实验生成机器学习模型的速度提高多达 2 倍。Amazon SageMaker Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型，同时允许您保持完全控制和可见性。

SageMaker Autopilot 提供两种训练模式 - 超参数优化 (HPO) 和集成。在 HPO 模式下，SageMaker Autopilot 选择与您的数据集最相关的算法，并选择最佳超参数范围以使用贝叶斯优化调整模型。但是，对于较大的数据集 (> 100MB)，使用贝叶斯优化进行调整的时间可能较长。即日起，SageMaker Autopilot 将使用一种新的多保真度超参数优化 (HPO) 策略，该策略对大于 100MB 且运行 100 次或更多次试验的数据集使用最先进的 Hyperband 调优算法，同时继续对小于 100MB 的数据集使用贝叶斯优化策略。通过多保真度优化策略，根据选定的客观指标会提前停止性能不佳的试验，从而为性能良好的试验释放资源。这样反过来会减少 HPO 训练模式 SageMaker Autopilot 试验对大型数据集的调整时间。

通过此版本，模型训练和调整速度会提高多达 2 倍，使客户可以更快地提供性能最佳的机器学习模型。为了评估性能提升幅度，我们使用了多个 OpenML 基准数据集，大小从 100MB 到 10GB 不等。根据我们的结果，中等大小的数据集 (100MB - 1GB) 运行时性能提高 41%（从平均 345 分钟缩短到 203 分钟），超大的数据集 (> 1GB) 运行时性能提高 48%（从平均 2010 分钟缩短到 1053 分钟）。由于此增强功能，您可以更快地运行 SageMaker Autopilot 试验，而无需对现有任务配置进行任何更改。

有关更多信息，请参阅文档，要了解有关 SageMaker Autopilot 的更多信息，请访问产品页面。

Amazon SageMaker Autopilot 实验在超参数优化训练模式下速度现已提高多达 2 倍

终止对 Internet Explorer 的支持