上周三,快消品企业A的又一款新品上市了,卖得非常好。到了这周一,短短5天的预售,原来备了两个月的货,已经有一小半给卖掉了,得马上决定是否需要补货。长周期物料、半成品加工、成品组装加到一起,整个补货周期是75天,都快11个星期了。现在的问题是,如何用5天的销量,来判断后续11周的销量?
上周三,快消品企业A的又一款新品上市了,卖得非常好。到了这周一,短短5天的预售,原来备了两个月的货,已经有一小半给卖掉了,得马上决定是否需要补货。长周期物料、半成品加工、成品组装加到一起,整个补货周期是75天,都快11个星期了。现在的问题是,如何用5天的销量,来判断后续11周的销量?
计划经理找到6个类似的产品,做出5天与后续11周销量的散点图,如图19。如果两者之间的线性关系成立,就把这款新品的5天销量代入,求得以后11周的预测,从而判断是否需要补货,要补的话补多少。线性回归的模型看上去相当不错----R平方值为0.9859,都快接近1了,理论上的线性拟合效果很好。但问题是,只有6个样本,样本数量太小,究竟有多少统计学上的意义?也就是说,从数理统计的角度看,这种关系是否成立?企业A问我该怎么办。
图19:样本太小,线性回归是否可靠?
样本太少,数理统计的确会打折扣,甚至失去统计学的意义。看到一些说法,对于简单线性回归,最少应该有10个样本----这只是有些人的经验总结,我们不是数理统计专家,很难证明[1]。在供应链领域,我们往往连10个样本也没有,就像这里的情况。
就这个案例来说,我不认为R平方这样的数理统计指标有多少意义。不过问题是,不用线性回归分析,我们的备选方案是什么?八成是找那个最有经验的人,或者最能够承担风险的人,让他拍脑袋,给你一个预测。那人是怎么拍脑袋的?他总得找一定的标杆来比较啊。那就是找到几个类似的产品,头脑中勾画出这条直线,做线性回归要做的事呗。你说他能把这6个类似的产品都找到,把那条直线画得那么贴切吗?当然不会。
想必我们知道该怎么办了吧。是的,样本太小的确有样本太小的问题,但在我看来,这里不完美的数据、不完美的数据分析,整体上仍然比拍脑袋要好,特别是在这个案例里,数据质量相当高,线性关系相当明显的情况下。这也是回到商业解决方案的本质:一个解决方案,即便不是最好,只要比原来的方案好,就值得采纳。我们要寻找的是更好的解决方案。
[1] Sample Size Formula, https://www.statisticssolutions.com/sample-size-formula/.
评论