预测准确度有多种统计方法,这里介绍常用的两种。
第一种是绝对误差百分比,亦即文献中常出现的MAPE[1]。这个指标说起来挺拗口,计算起来其实很简单:实际值减去预测,取绝对值,除以实际值,得到百分比,再把多期的百分比平均就是了。这个值很直观,但也容易误导:当实际值非常小,特别是接近0时,这一百分比可能很大。解决方案是设定上限,比如绝对误差的百分比不超过100%。
当然,有人或许会问,为什么是跟实际值比,而不是预测值?这是因为你的预测对象是实际值,你想跟它越近越好----你的目的是"击中"实际值,而不是预测值。那要比较的话,当然是跟实际发生的比较了,否则就成了"虚对虚"的数字游戏。
第二种是均方差,亦即文献中经常提到的MSE [2]。这是给每期预测和实际值的差值平方,然后再平均。平方的好处是放大极端误差:误差小了我们往往可以应对,比如设置安全库存,适当地赶工加急;害死我们的是极端误差----预测太低的话,安全库存很容易被击穿,导致高昂的赶工加急成本;预测太高的话,则容易造成大量的积压,以及由此而来的呆滞库存。
给误差平方,就是加倍"惩罚"那些超级误差,凸显那些极端虚高或虚低的预测值,也是我们应该重点避免的对象。如图1,6月份、10月份的绝对误差最大,我们通过平方,加倍"惩罚"这样的极端误差,最终反映在较高的12个月的平均误差(均方差)中。
图1:均方差示意
均方差并不能直观地体现预测的准确度。比如均方差是4436究竟意味着什么,谁也说不清。不过"不怕不识货,就怕货比货",在比较不同预测方法时,这一参数却非常有用----均方差越小,表明预测模型越准确。所以,均方差最小化是优化预测模型的重要考量。需要注意的是,均方差最小的时候,绝对误差百分比等其他预测准确度指标并不一定最小;反之亦然。
在评判预测模型好坏上,绝对误差的百分比挺直观,但因为其统计上的问题,往往会误导;均方差是个更好也更常用的评估指标,但是不够直观。不过,人们做决策,靠的不是"识货",而是"比货"----两个预测模型放到一起,一个的均方差是3.1,另一个的是7.2,你不用是个博士都知道哪个模型更准确了。
对于绝对误差百分比的误导,我们拿一个具体产品的例子来说明,如表 1。
对这个产品,第一种预测方法是指数平滑法,平滑系数为0.3(指数平滑法的细节我们后面讨论);第二种预测方法是移动平均法,13周移动平均。基于需求历史,我们复盘1到13周的需求预测;然后跟每周的实际值来比较,计算每种方法每一周的误差,算出每一周的绝对误差百分比、均方差;最后13周平均,得到每种预测方法的平均误差。
表 1:预测准确度的计算示例
如果按照绝对误差的百分,移动平均法优于指数平滑法:指数平滑法的误差为53%,而移动平均法为47%,后者更小。但从均方差来判断,结论正好相反。怎么办?我们回归到预测误差,看两种预测方法下,实际的误差对供应链的潜在影响。
如图 2,移动平均法(实线)的误差明显比指数平滑法(虚线)大,表现在多个极端值上,上下变动幅度更大,给供应链执行的挑战更大。相反,指数平滑法的实际误差更小,变动也更小,相对均匀地正负相间。显然,指数平滑法是个更好的方法,这也表现在其均方差值更小上。
图 2:两种预测方法的误差图
在学术研究中,鲜有例外,都是用均方差来评判预测准确度。在英文文献里,MSE是均方差的缩写,全称是Mean Squared Error。只要你读预测模型方面的英文著作,MSE是注定不会错过的。我能理解,在实践中,因为通俗易懂,很多时候我们还是用百分比;但在预测方法的择优上,均方差是个更靠谱的度量方法----你得相信那么多的教授、博士们用这种方法,自然是有其原因的。
评论