需求预测，样本太少怎么办？

2025年培训全新升级，开启报名

上周三，快消品企业A的又一款新品上市了，卖得非常好。到了这周一，短短5天的预售，原来备了两个月的货，已经有一小半给卖掉了，得马上决定是否需要补货。长周期物料、半成品加工、成品组装加到一起，整个补货周期是75天，都快11个星期了。现在的问题是，如何用5天的销量，来判断后续11周的销量？

计划经理找到6个类似的产品，做出5天与后续11周销量的散点图，如图19。如果两者之间的线性关系成立，就把这款新品的5天销量代入，求得以后11周的预测，从而判断是否需要补货，要补的话补多少。线性回归的模型看上去相当不错----R平方值为0.9859，都快接近1了，理论上的线性拟合效果很好。但问题是，只有6个样本，样本数量太小，究竟有多少统计学上的意义？也就是说，从数理统计的角度看，这种关系是否成立？企业A问我该怎么办。

图19：样本太小，线性回归是否可靠？

样本太少，数理统计的确会打折扣，甚至失去统计学的意义。看到一些说法，对于简单线性回归，最少应该有10个样本----这只是有些人的经验总结，我们不是数理统计专家，很难证明[1]。在供应链领域，我们往往连10个样本也没有，就像这里的情况。

就这个案例来说，我不认为R平方这样的数理统计指标有多少意义。不过问题是，不用线性回归分析，我们的备选方案是什么？八成是找那个最有经验的人，或者最能够承担风险的人，让他拍脑袋，给你一个预测。那人是怎么拍脑袋的？他总得找一定的标杆来比较啊。那就是找到几个类似的产品，头脑中勾画出这条直线，做线性回归要做的事呗。你说他能把这6个类似的产品都找到，把那条直线画得那么贴切吗？当然不会。

想必我们知道该怎么办了吧。是的，样本太小的确有样本太小的问题，但在我看来，这里不完美的数据、不完美的数据分析，整体上仍然比拍脑袋要好，特别是在这个案例里，数据质量相当高，线性关系相当明显的情况下。这也是回到商业解决方案的本质：一个解决方案，即便不是最好，只要比原来的方案好，就值得采纳。我们要寻找的是更好的解决方案。

[1] SampleSize Formula, https://www.statisticssolutions.com/sample-size-formula/.

25年5月供应链系列现场公开课