反身性:信念如何创造现实

一个让经济学失效的现象 1992年9月16日(“黑色星期三”),乔治·索罗斯(George Soros)做空英镑,一天赚了约10亿美元。1 他是怎么知道英镑会崩溃的? 传统金融理论说:市场价格反映所有可用信息,价格会回归"基本面"。如果英镑被高估,套利者会逐渐把价格拉回合理水平。 但索罗斯的理论完全不同:价格不是被动反映现实,价格主动创造现实。 当足够多的人相信英镑会贬值,他们会卖出英镑。卖出行为导致英镑真的贬值。贬值证实了预期,引发更多卖出。这个循环可以自我强化,直到系统崩溃。 索罗斯不是在预测"真实价值"。他是在识别一个反身性过程——一个信念自我实现的循环。 什么是反身性 反身性(Reflexivity)是索罗斯哲学的核心概念: 在有思考参与者的系统中,认知和现实之间存在双向反馈。 认知 → 影响行动 → 改变现实 → 改变认知 → ... 这打破了传统科学的基本假设:观察者独立于被观察对象。 在物理学中,你观察一个苹果不会改变苹果。 在金融市场中,你观察(并交易)一只股票会改变这只股票的价格。 这不是缺陷,这是社会现实的本质特征。 自我实现与自我挫败 反身性可以走两个方向: 自我实现的预言 银行挤兑是经典案例: 谣言说银行可能倒闭 担忧的储户提取存款 银行因流动性危机真的陷入困境 更多人恐慌提款 银行真的倒闭 银行原本可能是健康的。但预言本身创造了它预言的结果。 股票泡沫是另一个案例: 人们相信某股票会涨 买入推高价格 上涨"证明"了预期正确 更多人买入 价格远超基本面 直到信念崩塌 自我挫败的预言 有时候,预言本身会阻止它预言的事情发生。 如果所有人都预测明天会堵车,一些人会提前出发或选择其他路线。结果,堵车可能没有发生。 在金融市场中,如果一个套利机会被广泛知晓,套利行为本身会消除这个机会。 反身性的结构 索罗斯区分了两个功能: 认知功能:参与者试图理解现实 参与功能:参与者试图改变现实 在反身性过程中,这两个功能同时作用并相互干扰: 你对市场的理解影响你的行动 你的行动影响市场 市场的变化改变你的理解 你的新理解又影响你的新行动 这创造了一个不稳定的动态系统,而不是趋向均衡的稳定系统。 繁荣-萧条周期 反身性最重要的应用是解释市场周期。 繁荣阶段(自我强化的上升) 启动:某种基本面改善(真实的) 认知:投资者注意到改善 行动:买入推高价格 强化:价格上涨改善基本面(公司更容易融资、信心提升、消费增加) 加速:更高的价格吸引更多买家 泡沫:价格增长远超基本面 高峰:需要越来越大的信念才能支撑价格 萧条阶段(自我强化的下降) 触发:某个事件动摇信念 质疑:投资者开始怀疑 卖出:价格下跌 恶化:价格下跌恶化基本面(融资困难、信心崩溃、消费收缩) 恐慌:更低的价格引发更多卖出 崩溃:价格远低于基本面 底部:需要极端的悲观才能继续下跌 注意这个过程的关键特征:价格不是被动反映基本面,价格主动改变基本面。 ...

幸存者偏差:为什么成功学是毒药

二战中被忽视的洞见 1943年,美军面临一个问题:轰炸机被击落的比率太高。他们需要给飞机加装装甲,但装甲会增加重量、降低性能。所以只能加在最关键的位置。 工程师们统计了返航飞机上弹孔的分布,发现弹孔主要集中在机翼和机身。 结论似乎显然:应该在机翼和机身加装甲。 统计学家亚伯拉罕·瓦尔德(Abraham Wald)说:错了。应该在没有弹孔的地方加装甲——引擎和驾驶舱。1 为什么? 因为他们只看到了返航的飞机。那些引擎或驾驶舱中弹的飞机,根本没有机会返航。 这就是幸存者偏差(survivorship bias):我们只能看到幸存者,看不到已经消失的失败者。这导致我们对成功原因的判断系统性地错误。 成功学的致命谬误 现在市面上充斥着各种成功学: “我每天5点起床,所以我成功了。你也应该5点起床。” “我辍学创业,所以成功了。你也应该勇敢辍学。” “我相信自己,坚持了10年,所以成功了。你也应该坚持。” 这些故事有什么问题? 你只听到了成功者的故事。 那些每天5点起床但失败的人呢? 那些辍学创业但破产的人呢? 那些坚持了10年最终放弃的人呢? 他们的故事没有出版价值,不会被采访,不会上TED演讲。 所以你系统性地高估了"5点起床"“辍学"“坚持"与成功的关联。 数学上的理解 假设: 1000人尝试某种策略 10人成功,990人失败 成功率是1% 但我们只采访成功的10人。他们都说:“我用了这个策略,所以成功了。” 一个不知道990人失败的观察者会得出结论:这个策略有效。 实际上,这个策略的成功率只有1%。 更糟的是:如果这1000人什么都不做,可能也有1%会因为运气成功。 所以这个策略可能根本没用。但我们永远无法从幸存者的故事中知道这一点。 基金经理的神话 每年都有基金经理"战胜市场”。 如果有1000个基金经理随机投资: 第一年,约500人跑赢市场 第二年,约250人连续两年跑赢 第三年,约125人连续三年跑赢 第四年,约62人连续四年跑赢 第五年,约31人连续五年跑赢 连续五年跑赢市场!这31人一定是天才! 不。如果他们是掷硬币,也会有31人连续五次正面朝上。 我们把纯粹的概率当成了能力。 那些连续五年跑输市场的基金经理呢?他们的基金被关闭了,他们的职业生涯结束了。你永远不会听到他们的故事。 公司的幸存者偏差 “百年企业的成功秘诀是什么?” 当你研究活了100年的公司,你找到了一些共同点: 注重质量 关心员工 长期思维 结论:这些特质让公司长寿。 但等等。 那些也有这些特质但已经消失的公司呢? 也许100年前有1000家"注重质量、关心员工、长期思维"的公司,999家已经倒闭,只有1家活到今天。 你研究的不是"成功的原因”,你研究的是"幸存的结果”。 真正让公司长寿的可能是:运气、时代、位置、规模、网络效应——这些无法从幸存者身上学到的东西。 历史的幸存者偏差 我们读的历史是胜利者写的。 失败的帝国、消失的文明、被征服的民族——他们的故事很少流传。 这导致我们: 高估军事征服的有效性(征服者的故事流传下来) 低估和平贸易的重要性(商人的故事很少被记录) 对历史进程产生系统性错误理解 古代有多少思想家、科学家、艺术家?我们只知道那些作品恰好保存下来的人。 亚历山大图书馆烧毁时,消失了多少人类的智慧? 创业的真相 创业成功率大约是10%(宽泛定义的"成功")。2 如果定义为"赚到大钱",成功率可能是1%。 如果定义为"成为独角兽",成功率是0.01%。 但你听到的每一个创业故事都是成功的故事。 ...

均值回归:最被误解的统计概念

一个让天才困惑的现象 弗朗西斯·高尔顿(Francis Galton)是达尔文的表弟,统计学的奠基人之一。 1886年,他研究了一个简单问题:高个子父母的孩子有多高?1 结果令他困惑:高个子父母的孩子,平均来说比父母矮。矮个子父母的孩子,平均来说比父母高。 似乎所有人都在向平均值"回归"(mean reversion)。 高尔顿担心这意味着人类会越来越趋同,最终变成一模一样。 他错了。这不是因为任何神秘力量在拉动人们向中间靠拢。 这只是统计现象。 均值回归的本质 任何测量结果都包含两部分: 测量值 = 真实值 + 随机误差 高个子父母之所以被观察为"高个子",部分原因是他们的真实遗传身高较高,部分原因是测量时的随机因素(营养、测量误差、运气等)恰好是正向的。 他们的孩子继承了真实的遗传因素,但随机因素被重新抽样。 由于随机因素的期望值是零,孩子的测量值在统计上会更接近平均。 这不是任何力量在"拉回"。这只是:极端值更可能包含极端的随机成分,而随机成分在下一次测量时会回归平均。 一个关键的思想实验 想象一场考试: 学生的"真实能力"服从某种分布 考试成绩 = 真实能力 + 随机因素(当天状态、运气等) 现在,选出考试最高分的那些学生,让他们再考一次。 他们的第二次成绩会更低。 不是因为他们变笨了。是因为他们第一次的高分中包含了正向的随机因素,而随机因素在第二次考试中被重新抽样。 同样,选出最低分的学生再考一次,他们的成绩会提高。 这与能力变化无关,与任何干预无关,这是纯粹的统计现象。 被误解的因果关系 均值回归最危险的地方是:它创造了虚假的因果关系。 例子1:训斥与表扬 丹尼尔·卡尼曼(Daniel Kahneman)在《思考,快与慢》中讲述了一个经典案例。2 以色列空军的飞行教官发现: 当飞行员表现好,教官表扬后,下次表现往往变差 当飞行员表现差,教官训斥后,下次表现往往变好 结论:训斥有效,表扬有害。 这是错的。 表现好的飞行员下次变差,是因为他们这次表现包含了正向的随机因素。表现差的飞行员下次变好,是因为他们这次表现包含了负向的随机因素。 教官的训斥和表扬完全没有作用,但教官误以为是自己的干预产生了效果。 例子2:替代医学 病人在最难受的时候去尝试替代疗法。然后他们感觉好了一些。 结论:替代疗法有效。 不一定。 病人选择在症状最极端的时候就医。症状最极端意味着包含了极端的随机因素。即使什么都不做,下一次测量也很可能更接近平均——即感觉好一些。 这就是为什么需要随机对照实验,而不是靠"我用了然后好了"的叙事。 例子3:Sports Illustrated封面魔咒 登上《体育画报》封面的运动员,往往在接下来表现下滑。 “封面魔咒”? 不。运动员登上封面是因为他们最近表现极好。极好的表现包含正向随机因素。随机因素回归,表现自然下滑。 投资中的均值回归 表现最好的基金 去年表现最好的基金,今年往往表现平平。 这不是因为基金经理变笨了。这是因为: 去年的好表现包含了运气成分 运气成分在今年被重新抽样 期望值回归平均 追逐去年的"明星基金"是典型的均值回归陷阱。 估值的回归 市盈率极高的股票,长期平均来看表现差于市盈率低的股票。 部分原因是均值回归:极高估值意味着极端乐观预期。极端预期更可能包含错误。错误修正时,估值回归。 盈利的回归 公司盈利增长率也会均值回归。 ...

二阶思维:聪明人为什么会犯蠢

一个关于眼镜蛇的故事 英国殖民印度时期,德里有严重的眼镜蛇问题。 政府想了一个"聪明"的办法:悬赏捕蛇。每上交一条死蛇,就能获得奖金。 一阶思维:人们会捕蛇 → 蛇减少。 发生了什么? 人们开始养蛇。 当政府发现并取消悬赏时,养蛇人把蛇放归野外。 结果:眼镜蛇比之前更多了。 这就是只用一阶思维的代价。 什么是二阶思维 一阶思维(first-order thinking):这个行动的直接后果是什么? 二阶思维(second-order thinking):这个直接后果会引发什么反应?那些反应又会导致什么? 一阶思维是线性的:A → B。 二阶思维是循环的:A → B → C → 可能回到A。 大多数人只做一阶思考。这就是为什么政策经常失败、投资经常亏损、聪明人经常做出愚蠢的决定。 一阶思维的陷阱 案例1:租金管制 一阶思维:限制房租 → 租户受益。 二阶效应: 房东收益下降 → 减少维护投入 → 房屋质量下降 建新房不划算 → 供应减少 → 住房短缺加剧 有房者不愿搬走 → 流动性下降 → 新来者更难找房 长期结果:租户反而受害。 几乎所有研究都显示,长期租金管制会恶化住房问题。但它仍然是流行的政策,因为一阶效应是直观的,二阶效应是隐蔽的。 案例2:禁酒令 一阶思维:禁止酒精 → 人们不再喝酒。 二阶效应: 合法供应消失 → 黑市兴起 → 有组织犯罪获利 无法监管 → 质量无法保证 → 更多人因假酒中毒 执法成本巨大 → 腐败滋生 → 法治受损 长期结果:社会问题比禁酒前更严重。 ...

心理误判:为什么你的大脑在对付你

牛顿的亏损 1720年,艾萨克·牛顿投资了南海公司。他在早期买入,赚了约7,000英镑的利润——换算成今天大约是数百万美元。他卖出了。 然后他看着价格继续上涨。他的朋友们在赚钱。整个伦敦都在谈论南海公司。 牛顿重新买入——这次投入了大部分积蓄。 泡沫破裂后,他亏损了约20,000英镑。1 据说牛顿后来说过:“我能计算天体的运动,但无法计算人类的疯狂。” 这是人类历史上最聪明的大脑之一。发明了微积分、万有引力定律、光学理论。他不是不懂数学,不是不懂风险。 他是被自己的大脑打败了。 你不知道自己在犯错 心理误判最危险的地方不是让你犯错。是让你在犯错时感觉自己是对的。 你不会觉得"我正在被认知偏差影响"。你会觉得"我看得比谁都清楚"。 这就是为什么聪明人也会犯蠢——聪明甚至让问题更严重,因为聪明人更擅长给自己的错误编造精致的理由。牛顿不是盲目买入的。他一定有一套严密的逻辑来证明重新买入是合理的。这套逻辑是错的。但它感觉是对的。 查理·芒格(Charlie Munger)列出了25种人类心理倾向。2 他不是心理学家,是投资者。但他比大多数心理学家更关心一个问题:这些心理倾向如何让人在现实中做出灾难性的决策? 以下是对决策影响最大的几种。 社会认同(Social Proof) 牛顿重新买入南海公司的最大原因,不是他的分析,而是他周围的人都在赚钱。 当你不确定该怎么做时,你会看别人怎么做。这是人类的基本本能,在大多数场景下是合理的——一家餐厅门口排长队,食物可能不错。 但在金融市场中,社会认同是致命的。因为"别人在做"这个信号本身会改变结果: 一些人买入,价格上涨 上涨吸引更多人买入(“别人都在赚钱”) 更多买入导致更多上涨 上涨"证明"了买入是对的 直到所有人都已经买入,没有新的买家 崩盘 每一次泡沫——1720年的南海泡沫、1999年的互联网泡沫、2021年的某些加密货币——都是同样的心理机制。 反身性描述了这个过程的市场机制。社会认同解释了驱动力——“其他人都在做"是人类最难抵抗的说服力之一。 承诺与一致性偏差(Commitment & Consistency Bias) 牛顿在第一次卖出后重新买入,这已经是一个承诺。一旦做出了这个承诺,他的大脑会做一件事:拼命证明这个决定是对的。 买入一只股票后,你会不自觉地: 只关注支持你的信息(确认偏差) 忽略或贬低反对你的信息 在亏损时加倍下注(“我不可能错”) 向别人解释你的理由,进一步强化承诺 这不是理性分析。这是你的大脑在保护自我认同。 承认错误意味着承认"我的判断有问题”。大脑会竭力避免这种痛苦——它宁可让你亏更多钱,也不愿让你面对"我错了"这三个字。 这比机会成本中提到的沉没成本更深层。沉没成本是"舍不得已花的钱"。承诺一致性是"舍不得放弃已持有的信念"。前者损失金钱,后者损失身份认同。 实践中的解药: 在买入之前写下卖出的条件。把承诺给规则,不是给股票 定期问自己:“如果我今天没有持仓,我会按当前价格买入吗?” 寻求反对意见,而不是确认意见 被剥夺超级反应(Deprival Super-reaction) 人对"失去"的反应强度,大约是对"获得"同等价值的2倍。3 失去100元的痛苦,远大于获得100元的快乐。 这个不对称性解释了牛顿为什么重新买入:他无法忍受眼看着别人赚钱而自己不在场。不参与的痛苦(被剥夺感)超过了理性分析的力量。 在投资中,这种不对称创造了系统性的错误: 为什么人们不愿卖出亏损股:卖出意味着"确认"损失。持有保留了"可能回本"的幻觉。理性上知道应该止损,但感受上无法接受"让损失变成现实" 为什么市场下跌时恐慌卖出:当亏损加速,痛苦压过一切理性。你知道不应该恐慌,但你的身体在尖叫"停止痛苦" 为什么人们追涨:看到别人赚钱而自己没参与,产生的被剥夺感和真正的经济损失产生的痛苦是同一种 这种不对称性是凸性概念的心理学基础。人们系统性地对下行过度反应,对上行反应不足——这在市场中创造了凸性机会:被恐慌抛售的资产往往被低估。 锚定效应(Anchoring) 一只股票从100元跌到50元。你觉得"便宜了一半,值得买"。 但50元真的便宜吗?也许它的合理价值是20元。你不是在分析价值——你是被"100元"这个历史价格锚定了。 锚定效应的恶劣之处在于:你知道它存在,也无法完全消除它。 实验表明,即使明确告知受试者锚定效应的存在,他们的判断仍然被锚定值显著影响。 在投资中: 估值受同行对比影响——如果整个行业都被高估,“相对便宜"仍然可能是绝对昂贵 目标价受买入价影响——你希望"至少回本”,但市场不在乎你的成本价 对"历史高点"和"历史低点"的执着——这些数字对未来的价值毫无指导意义 安全边际部分是对锚定效应的防御:不要被市场价格锚定,用独立分析来确定价值。 可得性偏差(Availability Bias) 你会高估容易想到的事情的概率。 飞机失事上新闻,所以你高估飞行风险。心脏病不上新闻,所以你低估心脏病风险——尽管后者的杀伤力是前者的数千倍。 ...

激励机制:理解行为的万能钥匙

眼镜蛇效应 英属印度时期,德里的眼镜蛇泛滥。英国殖民政府想了一个办法:悬赏。每上交一条死眼镜蛇,奖励一笔钱。1 逻辑完美:人们有动力杀蛇 → 蛇减少 → 问题解决。 结果?人们开始养殖眼镜蛇来领赏金。 政府发现后取消了悬赏。养蛇人把失去经济价值的眼镜蛇全部放生。 德里的眼镜蛇比以前更多了。 查理·芒格(Charlie Munger)说过一句话,可能是理解人类行为最有力的工具: 给我看激励机制,我就能预测结果。 殖民政府想的是"人们会杀蛇"。实际发生的是"人们会按照最大化奖赏的方式行动"——而养蛇恰好是最高效的方式。 永远不要问"他为什么这样做"。问"他这样做的激励是什么"。 FedEx的一夜转变 另一面的故事。 FedEx早期有一个问题:夜班工人的包裹分拣效率太低,经常延误。 管理层试了很多方法:培训、监督、谈话、批评。都没用。 后来他们做了一件事:把按小时付薪改成按班次完成量付薪——分拣完就可以回家,薪水不变。 问题在一夜之间解决了。 工人没有变。工作没有变。能力没有变。只有激励变了。 眼镜蛇效应和FedEx是同一枚硬币的两面:当你改变激励,你就改变了行为。这比说教、培训、威胁有效一万倍。 激励 vs 利益攸关 利益攸关问的是:“他有没有承担后果?” 激励机制问的是更广的问题:“整个系统在鼓励什么行为?” 有利益攸关的人也可能做出错误决策——如果系统激励在推动他们朝错误方向走。 基金经理的例子 一位基金经理用自己的钱和客户的钱一起投资。他有利益攸关。 但他的收入结构是: 管理费:按资产规模的2%收取(和业绩无关) 业绩报酬:超额收益的20% 这个结构在激励什么行为? 管理10亿的基金,管理费2000万。即使业绩平庸,2000万的收入也很可观。但如果他追求高收益、承担大风险: 赢了:业绩报酬丰厚 输大了:客户赎回,资产规模缩小,管理费收入暴跌 激励的结论:跟随指数,不要犯大错,把资产规模做大。 不是"为客户获得最大回报",而是"不要和同行差太多"。 这就是为什么大多数主动管理基金的表现和指数差不多——不是因为基金经理没能力,而是因为激励结构在说:平庸是安全的,出众是危险的。 扭曲的激励:三个案例 医疗系统 在按项目付费(fee-for-service)的医疗系统中: 做更多检查 → 收入更高 开更多药 → 收入更高 让病人快速康复 → 收入减少(少了后续就诊) 激励在说:做更多事情,不管是否必要。 这不是因为医生不道德。大多数医生是好人。但系统在系统性地推动过度医疗。一个好人在坏的激励结构中,会做出坏的系统性决策。 改变这一点的方式不是要求医生"更有良心",而是改变激励结构——比如按健康结果付费。 信用评级机构 2008年之前: 评级由被评级的公司付费 给好评级 → 公司继续付费 给差评级 → 公司换一家评级机构 激励在说:给好评级。 结果?大量有毒的次级贷款产品被评为AAA级。分析师知道风险吗?可能知道。但激励结构不允许他们说出来——说出来意味着丢掉客户,丢掉客户意味着丢掉工作。 学术界 发表论文 → 获得终身教职 发现显著结果 → 容易发表 发现"没有效果" → 难以发表 激励在说:找到显著结果,不管是不是真的。 ...

Lollapalooza效应:当多重力量同时发作

一张20美元的钞票 经济学家Martin Shubik设计了一个实验:拍卖一张20美元钞票。1 规则很简单:价高者得。但有一个条件——第二高出价者也必须支付他的出价,但什么都得不到。 理性上,没有人应该出价超过20美元。 实际结果?人们经常为一张20美元的钞票支付50美元、60美元,甚至更多。 为什么?不是因为某一种心理偏差。是因为多种偏差同时发作: 承诺升级:我已经出价了,不能半途而废 损失厌恶:如果我现在退出,之前的出价就白白损失了 竞争唤醒:我不能让对手赢 锚定效应:再加一块钱就行了,只比上次多一点 社会压力:所有人都在看,退出就是认输 每种力量单独来看,你可能都能抵抗。但当它们同时作用、方向一致时?你为20美元付出了60美元,事后完全不明白自己怎么会如此愚蠢。 查理·芒格(Charlie Munger)给这种现象取了一个名字:Lollapalooza效应。 什么是Lollapalooza效应 当多种力量同向作用、相互强化时,结果会远远超出任何单一力量的预测。 单独一种心理偏差,你可能能抵抗。 单独一种市场力量,系统可能能承受。 单独一种制度缺陷,后果可能可控。 但当它们同时出现、方向一致、相互强化时,后果是爆炸性的。 1 + 1 不等于 2。在 Lollapalooza 中,1 + 1 可能等于 10。 安然:一个完美的 Lollapalooza 2001年,安然(Enron)从全美第七大公司变成破产废墟。几个月前,它还是华尔街的宠儿——《财富》杂志连续六年评选它为"全美最具创新力公司"。 事后来看,问题显而易见。但为什么当时几乎没有人看到? 因为不是一种力量在遮蔽真相——是六种力量同时发作: 力量1:扭曲的激励机制 高管薪酬与股价挂钩 → 激励操纵利润数字 按市值计价(mark-to-market)的会计方法 → 允许把未来预期利润一次性计入当期 审计师安达信同时为安然提供咨询服务(年咨询费甚至超过审计费)→ 激励不质疑 力量2:社会认同(心理误判) 华尔街最聪明的分析师都推荐买入 机构投资者大量持有 媒体一致赞美,质疑者被视为"不理解创新" 力量3:权威偏差 CEO Kenneth Lay是白宫常客 CFO Andrew Fastow被评为"最佳CFO" 整个管理团队被视为行业天才 力量4:承诺一致性 分析师公开推荐过安然,不愿承认自己错了 员工把退休金投入安然股票,心理上无法接受公司有问题 审计师之前签过无保留意见,改口意味着承认失职 力量5:复杂性作为武器 安然创建了数千个特殊目的实体(SPE)来隐藏债务 财报复杂到连专业分析师也看不懂 质疑者被反问"你是不是不够聪明才看不懂?" 力量6:反身性循环 高股价 → 更容易融资 → 表面上更成功 → 股价继续涨 许多SPE以安然股票作为担保 → 股价下跌会触发连锁崩溃 每一种力量单独来看,都是"行业中常见的问题"。每家公司都有激励扭曲,每个行业都有从众行为,每个复杂组织都有信息不对称。 ...