发布于: Jul 8, 2022
今天,我们很高兴地宣布,Amazon SageMaker Autopilot 试验的运行速度提高了多达 2 倍,可以生成具有高性能的 ML 模型。Amazon SageMaker Autopilot 是一款低代码机器学习 (ML) 产品,可以根据您的数据自动构建、训练和调优最佳 ML 模型,同时允许您保持完全控制和可见性。但是,随着数据集规模的增长,训练和调优模型的计算成本可能会变得很高。
即日起,SageMaker Autopilot 将使用零样本超参数初始化方法和 ml.m5.12xlarge 实例(48 个 vCPU,192GiB 的内存),以便将所需的默认试验的数量从 250 个减少到 100 个。因此,SageMaker Autopilot 试验将以比之前快了多达 2 倍的速度完成,并提供性能最佳的 ML 模型。为了评估性能提高幅度,我们使用了多个 OpenML 基准数据集,大小从 0.5MB 到 1GB 不等。结果表明,小型数据集 (< 100MB) 的总 Autopilot 任务运行时间缩短了多达 45%(从平均 230 分钟缩短到 120 分钟),而中等数据集 (> 100MB < 1GB) 和大型数据集 (> 1GB) 的运行时间分别缩短了 40%(从平均 540 分钟缩短到 430 分钟)。由于这些增强,您可以更快地运行 SageMaker Autopilot 试验,而无需对现有任务配置进行任何更改。
要详细了解 SageMaker Autopilot,请访问 SageMaker Autopilot 产品页面和文档。