亚马逊AWS官方博客

Amazon Forecast现可支持对单一条目进行准确性评估

原文链接:

https://aws.amazon.com/cn/about-aws/whats-new/2020/11/amazon-forecast-supports-accuracy-measurements-individual-items/

 

我们高兴地宣布,现在您已经可以在Amazon Forecast当中评估单一条目的预测准确性,借此更好地了解您的预测模型在最重要的少数核心条目上拥有怎样的预测表现。一般来说,改进对特定条目(例如价格较高或成本较高的条目)的预测准确性往往要比对全部条目进行整体增强更具现实意义。通过此次功能发布,现在您可以查看单一条目的准确性,并在训练期间观察其预测输出。利用这部分信息,您可以轻松将预测表现与观察到的真实历史需求进行比较,在自定义SKU或特定时段内的自定义集合中汇总各项准确性指标,或者在不保留单独验证数据集的前提下进行结果可视化,从而更好地解释结果。以此为基础,我们可以进一步定制实验,深入探索如何优化能够切实满足业务需求的核心条目的预测准确性。

特别是对于零售商而言,不同SKU往往有着不同的业务影响。一般来讲,零售行业遵循“二八定律”——即80%的收入主要来自20%的少数单品。因此,零售商当然更倾向于在这20%单品上获得更高的预测准确性。虽然我们可以为这前20%的单品创建独立的预测模型,但由于此模型完全接触不到其余80%的商品(条目),因此准确性很可能受到影响。此外,零售商也许更倾向于让某些商品保持高于所需的库存水平、并让另一些商品低于所需的库存水平,因此需要训练单一模型以评估不同库存水平下不同商品的预测准确性。

为了在条目层级或者部门层级评估预测准确性,我们通常会将验证数据集保留在Forecast之外,只向Forecast提供训练数据集以创建优化模型。在模型训练完成之后,我们可以生成多项预测,并将其与验证数据集进行比较。但这会增加实验阶段的成本,并削减Forecast在训练中所能接触的数据量。

通过今天的功能发布,现在大家可以访问Forecast内部测试中的预测值。此测试会将数据直接拆分为训练数据组与回测数据组,借此将预测结果同观察到的数据与条目级准确性指标进行比较。如此一来,我们无需在Forecast之外保留测试数据集。在训练模型的各步骤中,Forecast会自动将历史需求数据集划分为训练数据集组与回测数据集组。Forecast使用训练数据集进行模型,再将结果与回测数据集组内的观察值进行比较,从而在回测期间实现对不同指定库存水平的预测分析。现在,您可以随时导出各具体条目的回测预测结果与各个条目的准确性指标。

要针对特定条目或基于不同类别的自定义条目集对其预测模型进行强度评估,我们可以将这些条目的回测预测结果汇总起来,借此计算出准确性指标。如果您选择了不同的库存水平,还可以选择评估某些库存水平下的条目准确性,同时度量不同库存水平下其他条目的准确性。最后,现在您可以将回测预测导出至Amazon QuickSight或者您指定的任何其他可视化工具,借此轻松将预测结果与历史需求进行比较。

要使用此项功能,请参阅我们的博客以了解如何导出各条目的回测结果,同时参考CreatePredictorBacktestExportJob API。我们还在GitHub repo中提供一份notebook ,可帮助大家逐步了解如何使用Forecast API导出各条目的准确性指标,并据此计算出一组自定义条目的准确性指标。

现在,您可以在正式上线Forecast服务的所有AWS区域内使用此项功能。关于区域服务可用性的更多详细信息,请参阅区域表