一个让天才困惑的现象

弗朗西斯·高尔顿(Francis Galton)是达尔文的表弟,统计学的奠基人之一。

1886年,他研究了一个简单问题:高个子父母的孩子有多高?1

结果令他困惑:高个子父母的孩子,平均来说比父母矮。矮个子父母的孩子,平均来说比父母高。

似乎所有人都在向平均值"回归"(mean reversion)。

高尔顿担心这意味着人类会越来越趋同,最终变成一模一样。

他错了。这不是因为任何神秘力量在拉动人们向中间靠拢。

这只是统计现象。


均值回归的本质

任何测量结果都包含两部分:

测量值 = 真实值 + 随机误差

高个子父母之所以被观察为"高个子",部分原因是他们的真实遗传身高较高,部分原因是测量时的随机因素(营养、测量误差、运气等)恰好是正向的。

他们的孩子继承了真实的遗传因素,但随机因素被重新抽样。

由于随机因素的期望值是零,孩子的测量值在统计上会更接近平均。

这不是任何力量在"拉回"。这只是:极端值更可能包含极端的随机成分,而随机成分在下一次测量时会回归平均。


一个关键的思想实验

想象一场考试:

  • 学生的"真实能力"服从某种分布
  • 考试成绩 = 真实能力 + 随机因素(当天状态、运气等)

现在,选出考试最高分的那些学生,让他们再考一次。

他们的第二次成绩会更低。

不是因为他们变笨了。是因为他们第一次的高分中包含了正向的随机因素,而随机因素在第二次考试中被重新抽样。

同样,选出最低分的学生再考一次,他们的成绩会提高。

这与能力变化无关,与任何干预无关,这是纯粹的统计现象。


被误解的因果关系

均值回归最危险的地方是:它创造了虚假的因果关系。

例子1:训斥与表扬

丹尼尔·卡尼曼(Daniel Kahneman)在《思考,快与慢》中讲述了一个经典案例。2 以色列空军的飞行教官发现:

  • 当飞行员表现好,教官表扬后,下次表现往往变差
  • 当飞行员表现差,教官训斥后,下次表现往往变好

结论:训斥有效,表扬有害。

这是错的。 表现好的飞行员下次变差,是因为他们这次表现包含了正向的随机因素。表现差的飞行员下次变好,是因为他们这次表现包含了负向的随机因素。

教官的训斥和表扬完全没有作用,但教官误以为是自己的干预产生了效果。

例子2:替代医学

病人在最难受的时候去尝试替代疗法。然后他们感觉好了一些。

结论:替代疗法有效。

不一定。 病人选择在症状最极端的时候就医。症状最极端意味着包含了极端的随机因素。即使什么都不做,下一次测量也很可能更接近平均——即感觉好一些。

这就是为什么需要随机对照实验,而不是靠"我用了然后好了"的叙事。

例子3:Sports Illustrated封面魔咒

登上《体育画报》封面的运动员,往往在接下来表现下滑。

“封面魔咒”?

不。运动员登上封面是因为他们最近表现极好。极好的表现包含正向随机因素。随机因素回归,表现自然下滑。


投资中的均值回归

表现最好的基金

去年表现最好的基金,今年往往表现平平。

这不是因为基金经理变笨了。这是因为:

  1. 去年的好表现包含了运气成分
  2. 运气成分在今年被重新抽样
  3. 期望值回归平均

追逐去年的"明星基金"是典型的均值回归陷阱。

估值的回归

市盈率极高的股票,长期平均来看表现差于市盈率低的股票。

部分原因是均值回归:极高估值意味着极端乐观预期。极端预期更可能包含错误。错误修正时,估值回归。

盈利的回归

公司盈利增长率也会均值回归。

极高增长的公司往往增速放缓。极低增长的公司往往增速回升(如果它们能活下去)。

这不是神秘力量,这是:

  • 基数效应
  • 竞争压力
  • 管理层能力的真实值更接近平均

均值回归的陷阱

陷阱1:忽略结构性变化

均值回归假设"真实值"不变,只是随机因素在波动。

但有时候,“真实值"本身发生了变化。

柯达的衰落不是均值回归。这是技术革命导致的结构性变化。如果你期待柯达"回归"到过去的盈利水平,你会亏很多钱。

均值回归只在稳定系统中有效。

陷阱2:不知道均值在哪里

向均值回归——但均值是多少?

你假设的均值可能是错的。也许市场整体估值已经永久提升。也许某公司的正常盈利水平已经永久下降。

向错误的均值"回归"会让你在错误的方向上持续亏损。

陷阱3:回归的时间尺度

均值回归会发生,但什么时候发生?

一个极端值可能需要几个月、几年、甚至几十年才能回归。在这期间,你可能已经破产。

凯恩斯说:“市场保持非理性的时间,可能比你保持偿付能力的时间更长。“这也是为什么安全边际如此重要——你需要足够的缓冲来等待回归发生。


如何正确使用均值回归

1. 作为思维框架,而非交易策略

均值回归告诉你:对极端值保持怀疑

  • 极好的表现可能包含运气
  • 极差的表现可能包含厄运
  • 极端预期更可能被修正

但这不意味着你应该自动反向押注。

2. 区分均值回归和趋势逆转

均值回归:随机波动围绕稳定的真实值 趋势逆转:真实值本身的方向改变

混淆两者是危险的。

3. 寻找回归的催化剂

仅仅因为"这太极端了,应该回归"而下注是危险的。

更好的策略是:识别能让回归发生的具体机制。

  • 竞争对手进入
  • 监管变化
  • 资本周期
  • 预期修正

4. 控制时间风险

即使你对方向正确,时机错误也可能致命。

如果你预期均值回归但需要三年才能发生,你的投资论文可能是对的,但你的账户可能已经归零。


更深层的洞见

均值回归揭示了一个认识论的真相:

我们观察到的极端值,本身就是被选择的样本。

  • 你注意到表现最好的基金(因为它们被报道)
  • 你注意到最成功的公司(因为它们被讨论)
  • 你注意到最极端的预测者(因为他们被关注)

这些被选择出来的样本,在统计上注定要向平均回归

这不是诅咒,这是数学。这也与幸存者偏差相关——我们关注的极端成功案例,不仅被选择性地呈现,而且在统计上注定会回归。


关键区分

统计上的均值回归:极端观察值中的随机成分在下次测量时被重新抽样,因此结果更接近平均值。这是数学必然。

交易策略的均值回归:押注价格会回到历史平均。这需要假设"真实价值"不变,而这个假设经常是错的。

两者使用同一个名字,但完全不同。混淆它们是危险的。


一句话总结

极端表现包含极端运气,而运气会被重新抽样。

这不是预测工具——你不知道均值在哪里,也不知道回归需要多久。

这是认知工具——帮你理解为什么"封面魔咒"不是诅咒,为什么训斥不比表扬有效。


  1. Francis Galton, “Regression Towards Mediocrity in Hereditary Stature”, Journal of the Anthropological Institute, 15, 1886, pp. 246-263. ↩︎

  2. Daniel Kahneman,《Thinking, Fast and Slow》, Farrar, Straus and Giroux, 2011. 中文版:《思考,快与慢》。 ↩︎