一个让天才困惑的现象
弗朗西斯·高尔顿(Francis Galton)是达尔文的表弟,统计学的奠基人之一。
1886年,他研究了一个简单问题:高个子父母的孩子有多高?1
结果令他困惑:高个子父母的孩子,平均来说比父母矮。矮个子父母的孩子,平均来说比父母高。
似乎所有人都在向平均值"回归"(mean reversion)。
高尔顿担心这意味着人类会越来越趋同,最终变成一模一样。
他错了。这不是因为任何神秘力量在拉动人们向中间靠拢。
这只是统计现象。
均值回归的本质
任何测量结果都包含两部分:
测量值 = 真实值 + 随机误差
高个子父母之所以被观察为"高个子",部分原因是他们的真实遗传身高较高,部分原因是测量时的随机因素(营养、测量误差、运气等)恰好是正向的。
他们的孩子继承了真实的遗传因素,但随机因素被重新抽样。
由于随机因素的期望值是零,孩子的测量值在统计上会更接近平均。
这不是任何力量在"拉回"。这只是:极端值更可能包含极端的随机成分,而随机成分在下一次测量时会回归平均。
一个关键的思想实验
想象一场考试:
- 学生的"真实能力"服从某种分布
- 考试成绩 = 真实能力 + 随机因素(当天状态、运气等)
现在,选出考试最高分的那些学生,让他们再考一次。
他们的第二次成绩会更低。
不是因为他们变笨了。是因为他们第一次的高分中包含了正向的随机因素,而随机因素在第二次考试中被重新抽样。
同样,选出最低分的学生再考一次,他们的成绩会提高。
这与能力变化无关,与任何干预无关,这是纯粹的统计现象。
被误解的因果关系
均值回归最危险的地方是:它创造了虚假的因果关系。
例子1:训斥与表扬
丹尼尔·卡尼曼(Daniel Kahneman)在《思考,快与慢》中讲述了一个经典案例。2 以色列空军的飞行教官发现:
- 当飞行员表现好,教官表扬后,下次表现往往变差
- 当飞行员表现差,教官训斥后,下次表现往往变好
结论:训斥有效,表扬有害。
这是错的。 表现好的飞行员下次变差,是因为他们这次表现包含了正向的随机因素。表现差的飞行员下次变好,是因为他们这次表现包含了负向的随机因素。
教官的训斥和表扬完全没有作用,但教官误以为是自己的干预产生了效果。
例子2:替代医学
病人在最难受的时候去尝试替代疗法。然后他们感觉好了一些。
结论:替代疗法有效。
不一定。 病人选择在症状最极端的时候就医。症状最极端意味着包含了极端的随机因素。即使什么都不做,下一次测量也很可能更接近平均——即感觉好一些。
这就是为什么需要随机对照实验,而不是靠"我用了然后好了"的叙事。
例子3:Sports Illustrated封面魔咒
登上《体育画报》封面的运动员,往往在接下来表现下滑。
“封面魔咒”?
不。运动员登上封面是因为他们最近表现极好。极好的表现包含正向随机因素。随机因素回归,表现自然下滑。
投资中的均值回归
表现最好的基金
去年表现最好的基金,今年往往表现平平。
这不是因为基金经理变笨了。这是因为:
- 去年的好表现包含了运气成分
- 运气成分在今年被重新抽样
- 期望值回归平均
追逐去年的"明星基金"是典型的均值回归陷阱。
估值的回归
市盈率极高的股票,长期平均来看表现差于市盈率低的股票。
部分原因是均值回归:极高估值意味着极端乐观预期。极端预期更可能包含错误。错误修正时,估值回归。
盈利的回归
公司盈利增长率也会均值回归。
极高增长的公司往往增速放缓。极低增长的公司往往增速回升(如果它们能活下去)。
这不是神秘力量,这是:
- 基数效应
- 竞争压力
- 管理层能力的真实值更接近平均
均值回归的陷阱
陷阱1:忽略结构性变化
均值回归假设"真实值"不变,只是随机因素在波动。
但有时候,“真实值"本身发生了变化。
柯达的衰落不是均值回归。这是技术革命导致的结构性变化。如果你期待柯达"回归"到过去的盈利水平,你会亏很多钱。
均值回归只在稳定系统中有效。
陷阱2:不知道均值在哪里
向均值回归——但均值是多少?
你假设的均值可能是错的。也许市场整体估值已经永久提升。也许某公司的正常盈利水平已经永久下降。
向错误的均值"回归"会让你在错误的方向上持续亏损。
陷阱3:回归的时间尺度
均值回归会发生,但什么时候发生?
一个极端值可能需要几个月、几年、甚至几十年才能回归。在这期间,你可能已经破产。
凯恩斯说:“市场保持非理性的时间,可能比你保持偿付能力的时间更长。“这也是为什么安全边际如此重要——你需要足够的缓冲来等待回归发生。
如何正确使用均值回归
1. 作为思维框架,而非交易策略
均值回归告诉你:对极端值保持怀疑。
- 极好的表现可能包含运气
- 极差的表现可能包含厄运
- 极端预期更可能被修正
但这不意味着你应该自动反向押注。
2. 区分均值回归和趋势逆转
均值回归:随机波动围绕稳定的真实值 趋势逆转:真实值本身的方向改变
混淆两者是危险的。
3. 寻找回归的催化剂
仅仅因为"这太极端了,应该回归"而下注是危险的。
更好的策略是:识别能让回归发生的具体机制。
- 竞争对手进入
- 监管变化
- 资本周期
- 预期修正
4. 控制时间风险
即使你对方向正确,时机错误也可能致命。
如果你预期均值回归但需要三年才能发生,你的投资论文可能是对的,但你的账户可能已经归零。
更深层的洞见
均值回归揭示了一个认识论的真相:
我们观察到的极端值,本身就是被选择的样本。
- 你注意到表现最好的基金(因为它们被报道)
- 你注意到最成功的公司(因为它们被讨论)
- 你注意到最极端的预测者(因为他们被关注)
这些被选择出来的样本,在统计上注定要向平均回归。
这不是诅咒,这是数学。这也与幸存者偏差相关——我们关注的极端成功案例,不仅被选择性地呈现,而且在统计上注定会回归。
关键区分
统计上的均值回归:极端观察值中的随机成分在下次测量时被重新抽样,因此结果更接近平均值。这是数学必然。
交易策略的均值回归:押注价格会回到历史平均。这需要假设"真实价值"不变,而这个假设经常是错的。
两者使用同一个名字,但完全不同。混淆它们是危险的。
一句话总结
极端表现包含极端运气,而运气会被重新抽样。
这不是预测工具——你不知道均值在哪里,也不知道回归需要多久。
这是认知工具——帮你理解为什么"封面魔咒"不是诅咒,为什么训斥不比表扬有效。