发布于: Nov 29, 2023

今天,我们很高兴地宣布 Amazon SageMaker 全新的智能筛选功能预览版正式发布,该功能可自动即时检查和评估训练数据,从而有选择地仅从信息量最大的数据样本中学习,从而将模型训练时间和成本最多减少 35%。您可以在几分钟内开始进行智能数据筛选,而无需更改现有的数据管道或训练脚本。

智能筛选在训练期间使用您的实时模型来分析传入的数据样本。然后,它会自动丢弃损失较小、无法改善模型学习过程的样本。通过选择性地仅使用信息量最大的数据样本,智能筛选减少了训练深度学习模型的时间和成本。客户在 SageMaker 的加速 GPU 实例上使用 PyTorch 训练深度学习模型,最多可缩短 35% 的训练时间。由于排除的样本损失相对较低,因此对训练模型准确性的影响很小或没有影响。要开始进行智能筛选,请参阅我们的相关文档