均值回归：最被误解的统计概念

一个让天才困惑的现象

弗朗西斯·高尔顿（Francis Galton）是达尔文的表弟，统计学的奠基人之一。

1886年，他研究了一个简单问题：高个子父母的孩子有多高？¹

结果令他困惑：高个子父母的孩子，平均来说比父母矮。矮个子父母的孩子，平均来说比父母高。

似乎所有人都在向平均值"回归"（mean reversion）。

高尔顿担心这意味着人类会越来越趋同，最终变成一模一样。

他错了。这不是因为任何神秘力量在拉动人们向中间靠拢。

这只是统计现象。

均值回归的本质

任何测量结果都包含两部分：

测量值 = 真实值 + 随机误差

高个子父母之所以被观察为"高个子"，部分原因是他们的真实遗传身高较高，部分原因是测量时的随机因素（营养、测量误差、运气等）恰好是正向的。

他们的孩子继承了真实的遗传因素，但随机因素被重新抽样。

由于随机因素的期望值是零，孩子的测量值在统计上会更接近平均。

这不是任何力量在"拉回"。这只是：极端值更可能包含极端的随机成分，而随机成分在下一次测量时会回归平均。

一个关键的思想实验

想象一场考试：

学生的"真实能力"服从某种分布
考试成绩 = 真实能力 + 随机因素（当天状态、运气等）

现在，选出考试最高分的那些学生，让他们再考一次。

他们的第二次成绩会更低。

不是因为他们变笨了。是因为他们第一次的高分中包含了正向的随机因素，而随机因素在第二次考试中被重新抽样。

同样，选出最低分的学生再考一次，他们的成绩会提高。

这与能力变化无关，与任何干预无关，这是纯粹的统计现象。

被误解的因果关系

均值回归最危险的地方是：它创造了虚假的因果关系。

例子1：训斥与表扬

丹尼尔·卡尼曼（Daniel Kahneman）在《思考，快与慢》中讲述了一个经典案例。² 以色列空军的飞行教官发现：

当飞行员表现好，教官表扬后，下次表现往往变差
当飞行员表现差，教官训斥后，下次表现往往变好

结论：训斥有效，表扬有害。

这是错的。 表现好的飞行员下次变差，是因为他们这次表现包含了正向的随机因素。表现差的飞行员下次变好，是因为他们这次表现包含了负向的随机因素。

教官的训斥和表扬完全没有作用，但教官误以为是自己的干预产生了效果。

例子2：替代医学

病人在最难受的时候去尝试替代疗法。然后他们感觉好了一些。

结论：替代疗法有效。

不一定。 病人选择在症状最极端的时候就医。症状最极端意味着包含了极端的随机因素。即使什么都不做，下一次测量也很可能更接近平均——即感觉好一些。

这就是为什么需要随机对照实验，而不是靠"我用了然后好了"的叙事。

例子3：Sports Illustrated封面魔咒

登上《体育画报》封面的运动员，往往在接下来表现下滑。

“封面魔咒”？

不。运动员登上封面是因为他们最近表现极好。极好的表现包含正向随机因素。随机因素回归，表现自然下滑。

投资中的均值回归

表现最好的基金

去年表现最好的基金，今年往往表现平平。

这不是因为基金经理变笨了。这是因为：

去年的好表现包含了运气成分
运气成分在今年被重新抽样
期望值回归平均

追逐去年的"明星基金"是典型的均值回归陷阱。

估值的回归

市盈率极高的股票，长期平均来看表现差于市盈率低的股票。

部分原因是均值回归：极高估值意味着极端乐观预期。极端预期更可能包含错误。错误修正时，估值回归。

盈利的回归

公司盈利增长率也会均值回归。

极高增长的公司往往增速放缓。极低增长的公司往往增速回升（如果它们能活下去）。

这不是神秘力量，这是：

基数效应
竞争压力
管理层能力的真实值更接近平均

均值回归的陷阱

陷阱1：忽略结构性变化

均值回归假设"真实值"不变，只是随机因素在波动。

但有时候，“真实值"本身发生了变化。

柯达的衰落不是均值回归。这是技术革命导致的结构性变化。如果你期待柯达"回归"到过去的盈利水平，你会亏很多钱。

均值回归只在稳定系统中有效。

陷阱2：不知道均值在哪里

向均值回归——但均值是多少？

你假设的均值可能是错的。也许市场整体估值已经永久提升。也许某公司的正常盈利水平已经永久下降。

向错误的均值"回归"会让你在错误的方向上持续亏损。

陷阱3：回归的时间尺度

均值回归会发生，但什么时候发生？

一个极端值可能需要几个月、几年、甚至几十年才能回归。在这期间，你可能已经破产。

凯恩斯说：“市场保持非理性的时间，可能比你保持偿付能力的时间更长。“这也是为什么安全边际如此重要——你需要足够的缓冲来等待回归发生。

如何正确使用均值回归

1. 作为思维框架，而非交易策略

均值回归告诉你：对极端值保持怀疑。

极好的表现可能包含运气
极差的表现可能包含厄运
极端预期更可能被修正

但这不意味着你应该自动反向押注。

2. 区分均值回归和趋势逆转

均值回归：随机波动围绕稳定的真实值趋势逆转：真实值本身的方向改变

混淆两者是危险的。

3. 寻找回归的催化剂

仅仅因为"这太极端了，应该回归"而下注是危险的。

更好的策略是：识别能让回归发生的具体机制。

竞争对手进入
监管变化
资本周期
预期修正

4. 控制时间风险

即使你对方向正确，时机错误也可能致命。

如果你预期均值回归但需要三年才能发生，你的投资论文可能是对的，但你的账户可能已经归零。

更深层的洞见

均值回归揭示了一个认识论的真相：

我们观察到的极端值，本身就是被选择的样本。

你注意到表现最好的基金（因为它们被报道）
你注意到最成功的公司（因为它们被讨论）
你注意到最极端的预测者（因为他们被关注）

这些被选择出来的样本，在统计上注定要向平均回归。

这不是诅咒，这是数学。这也与幸存者偏差相关——我们关注的极端成功案例，不仅被选择性地呈现，而且在统计上注定会回归。

关键区分

统计上的均值回归：极端观察值中的随机成分在下次测量时被重新抽样，因此结果更接近平均值。这是数学必然。

交易策略的均值回归：押注价格会回到历史平均。这需要假设"真实价值"不变，而这个假设经常是错的。

两者使用同一个名字，但完全不同。混淆它们是危险的。

一句话总结

极端表现包含极端运气，而运气会被重新抽样。

这不是预测工具——你不知道均值在哪里，也不知道回归需要多久。

这是认知工具——帮你理解为什么"封面魔咒"不是诅咒，为什么训斥不比表扬有效。

Francis Galton, “Regression Towards Mediocrity in Hereditary Stature”, Journal of the Anthropological Institute, 15, 1886, pp. 246-263. ↩︎
Daniel Kahneman,《Thinking, Fast and Slow》, Farrar, Straus and Giroux, 2011. 中文版：《思考，快与慢》。 ↩︎

一个让天才困惑的现象#

均值回归的本质#

一个关键的思想实验#

被误解的因果关系#

例子1：训斥与表扬#

例子2：替代医学#

例子3：Sports Illustrated封面魔咒#

投资中的均值回归#

表现最好的基金#

估值的回归#

盈利的回归#

均值回归的陷阱#

陷阱1：忽略结构性变化#

陷阱2：不知道均值在哪里#

陷阱3：回归的时间尺度#

如何正确使用均值回归#

1. 作为思维框架，而非交易策略#

2. 区分均值回归和趋势逆转#

3. 寻找回归的催化剂#

4. 控制时间风险#

更深层的洞见#

关键区分#

一句话总结#