引子:天气预报说有70%降雨概率…

早上7点,你准备出门。

打开天气App:今天降雨概率70%

你会带伞吗?

场景A:你心想"70%肯定会下雨",带了伞。结果一整天阳光灿烂。

你的反应:“天气预报又骗人!”

场景B:你心想"还有30%不下雨呢",没带伞。结果下午暴雨。

你的反应:“早知道就带伞了!”

两种情况,你都觉得自己做错了。

但真的是这样吗?

这个场景揭示了人类大脑的一个根本缺陷:

我们不擅长概率思维(Probabilistic Thinking)。

我们的大脑喜欢确定性

  • “会下雨” 或 “不会下雨”
  • “买这只股票” 或 “不买”
  • “这个项目成功” 或 “失败”

但现实世界充满不确定性

  • 天气:70% 概率降雨
  • 股市:60% 概率明年上涨
  • 创业:5% 概率成为独角兽

今天,我们要学习一种全新的思维方式:用概率而非确定性来看世界。

核心概念:什么是概率思维

定义与本质

Probabilistic Thinking(概率思维)

概率分布而非单一结果来思考问题,在不确定性中做出更优决策。

核心转变

确定性思维概率思维
“这个会发生”“这个有X%概率发生”
“我是对的”“我有Y%把握是对的”
“这是答案”“这是Z%置信区间的答案”
非黑即白灰度连续
结果导向过程导向

关键洞察

好的决策 ≠ 好的结果

坏的结果 ≠ 坏的决策

Annie Duke的扑克哲学

Annie Duke,世界扑克锦标赛冠军,著有《Thinking in Bets》。

她说:

“人生是一场不完美信息下的概率博弈,就像扑克。”

“在扑克中,你可能做了完美决策,但依然输掉这一局。因为对手运气好。”

“关键不是这一局的输赢,而是长期你的决策质量。”

扑克vs国际象棋

维度国际象棋扑克
信息完全信息不完全信息(看不到对手的牌)
随机性无随机有随机(发牌)
决策存在"最优解"只有"最优概率"
评判胜负清晰短期胜负可能误导
类比数学、工程商业、投资、人生

真实世界更像扑克,而非象棋。

  • 你看不到"全局信息"(竞争对手策略、宏观经济未来)
  • 有运气成分(疫情、地缘政治)
  • 短期结果有噪音(一次决策的输赢不代表决策质量)

所以,你需要概率思维。

贝叶斯思维:不断更新信念

Thomas Bayes(1701-1761),英国数学家,提出贝叶斯定理:

P(A|B) = P(B|A) × P(A) / P(B)

翻译:
后验概率 = (似然度 × 先验概率) / 证据概率

用人话说

当你获得新信息时,应该如何更新你的信念?

例子:医疗检测

场景

  • 某疾病在人群中发病率:1%(先验概率)
  • 检测准确率:99%(敏感度和特异度都是99%)
  • 你检测结果:阳性

:你真的患病的概率是多少?

直觉答案:99%(因为检测准确率99%)

正确答案(贝叶斯计算)

P(患病|阳性) = P(阳性|患病) × P(患病) / P(阳性)

其中:
P(阳性|患病) = 0.99 (敏感度)
P(患病) = 0.01 (先验概率)
P(阳性) = P(阳性|患病)×P(患病) + P(阳性|健康)×P(健康)
        = 0.99 × 0.01 + 0.01 × 0.99
        = 0.0198

P(患病|阳性) = (0.99 × 0.01) / 0.0198
              ≈ 0.5
              = 50%

震惊吗?

即使检测准确率99%,阳性结果也只意味着50%概率患病

原因

  • 疾病罕见(1%)
  • 所以阳性结果中,有一半是假阳性(来自99%健康人群的1%误检)

这就是贝叶斯思维的威力:结合先验概率与新证据。

概率思维的三大支柱

支柱1:期望值(Expected Value)

定义

EV = Σ (结果 × 概率)

简单例子:赌博

游戏:

  • 投入$10
  • 50%概率赢$30
  • 50%概率输掉$10

期望值:

EV = 0.5 × $30 + 0.5 × (-$10)
   = $15 - $5
   = $10

EV > 0,这是正期望值游戏,应该玩。

复杂例子:创业

场景

  • 投入:1年时间 + $50,000存款
  • 成功(5%):5年后退出,赚$500万
  • 小成功(20%):养活自己,年收入$10万
  • 失败(75%):1年后回打工,损失$5万+机会成本$10万

期望值(财务)

EV = 0.05 × $5,000,000
   + 0.20 × ($100,000 × 5)
   + 0.75 × (-$150,000)

   = $250,000 + $100,000 - $112,500
   = $237,500

看起来应该创业?

但等等

期望值只是平均值,不考虑你的效用函数(Utility Function)

效用函数:金钱对你的真实价值,非线性。

  • 如果你有$1万存款,损失$5万 = 破产 = 效用-∞
  • 如果你有$500万,损失$5万 = 1% = 效用-0.01

所以,期望值为正 ≠ 应该做

需要考虑:

  1. 破产风险(Kelly Criterion,后面讲)
  2. 效用曲线(风险厌恶程度)
  3. 替代选项(机会成本)

启示

期望值是必要条件,不是充分条件。

支柱2:概率分布(Probability Distribution)

大多数人的思维

“这个项目会赚多少钱?”

答:“大概$100万”

概率思维者的思维

“这个项目的结果分布是什么?”

答:

P($0) = 30%        (失败)
P($50万) = 40%     (小成功)
P($100万) = 20%    (中等成功)
P($500万) = 8%     (大成功)
P($2000万) = 2%    (巨大成功)

为什么要用分布而非点估计?

1. 避免锚定偏差

如果只给出"$100万",大脑会锚定这个数字。

实际结果$50万时,你会觉得"失败了"(虽然$50万可能性最大)。

2. 暴露假设

分布的形状暴露了你的假设:

  • 正态分布(钟形曲线):大多数结果集中在均值附近

    • 适用:成熟业务的季度收入
  • 幂律分布(长尾):少数极端结果占主导

    • 适用:创业公司估值、畅销书销量、城市人口
  • 双峰分布:两个峰(要么成功要么失败)

    • 适用:二选一的决策(如并购)

3. 量化不确定性

均值:$100万
标准差:$200万

这告诉你:
- 结果高度不确定
- 可能范围:$-100万 到 $500万(2个标准差)

支柱3:样本大小与信号噪音比

问题:你投资了一只股票,一周后跌了5%。你应该卖出吗?

一阶思维:“跌了,说明我判断错了,赶紧卖。”

概率思维

“样本大小太小,信号被噪音淹没。”

概念

  • 信号(Signal):真实的趋势、底层驱动因素
  • 噪音(Noise):随机波动、短期扰动

信号噪音比(SNR)

SNR = 信号强度 / 噪音强度

股市的SNR

时间范围噪音占比信号占比评论
1天~99%~1%几乎全是噪音
1周~95%~5%依然噪音主导
1个月~80%~20%噪音仍占主导
1年~50%~50%开始有意义
5年~20%~80%信号清晰
10年~5%~95%基本是信号

Daniel Kahneman的研究

基金经理的年度业绩与未来业绩的相关性 ≈ 0.01

翻译:1年的业绩几乎完全是噪音,不能预测未来。

但投资者会根据1年业绩做决策(赎回/加仓)→ 错误决策。

启示

样本越小,噪音越大,结论越不可靠。

解决方案

  1. 增大样本

    • 不看1天涨跌,看1年
    • 不看1个客户反馈,看100个
  2. 重复实验

    • A/B测试运行至统计显著
    • 策略回测覆盖多个市场周期
  3. 贝叶斯更新

    • 新证据 + 先验信念 → 后验信念
    • 不因单一事件大幅改变判断

概率思维的实践框架

工具1:预测区间而非点估计

错误做法

“我们明年营收会是$500万”

正确做法

“我们明年营收有:

  • 90%置信区间:$300万 - $800万
  • 50%置信区间:$400万 - $600万
  • 最可能值(众数):$500万”

为什么这样更好?

  1. 诚实表达不确定性
  2. 可以事后检验准确性(Calibration)
  3. 避免过度自信

Philip Tetlock的研究(《超预测》Superforecasting):

优秀预测者的特征:

  • 用概率表达(“60%概率”)
  • 频繁更新预测(贝叶斯)
  • 追踪校准度(预测vs实际)

普通人的问题

  • 说"肯定"时,真实概率只有80%
  • 说"不可能"时,真实概率还有20%

过度自信

工具2:前验尸(Pre-Mortem)+ 前庆功(Pre-Parade)

Gary Klein提出的Pre-Mortem

在项目启动前,假设项目已经失败

然后问:“发生了什么?”

例子:新产品发布

Pre-Mortem场景

“现在是1年后,产品惨败,只卖出100个。原因是?”

团队头脑风暴:

  • 目标用户不存在(伪需求)
  • 定价太高
  • 竞争对手提前发布类似产品
  • 技术无法按时交付
  • 营销预算不足
  • 渠道合作谈不下来

结果

识别出15个潜在失败原因。

针对每个,设计应对策略:

  • 前3个月小范围测试(验证需求)
  • 制定降价预案
  • 申请专利(防止竞争)
  • 技术方案冗余

Pre-Parade(我自己加的)

同样,假设项目超级成功

“现在是1年后,产品爆了,卖出10万个。发生了什么?”

团队头脑风暴:

  • 口碑传播(用户主动推荐)
  • 媒体报道(TechCrunch, Product Hunt)
  • KOL背书(某大V使用)
  • 踩中趋势(如疫情期间远程办公工具)
  • 竞争对手犯错(如Instagram当年Facebook搞砸移动端)

结果

识别关键成功因素,主动创造条件

  • 设计分享机制(病毒循环)
  • PR计划(主动pitch媒体)
  • KOL策略(送产品给关键意见领袖)
  • 趋势监测(保持敏感)

两者结合

Pre-Mortem降低失败概率,Pre-Parade提高成功概率。

工具3:Kelly Criterion(凯利公式)

问题:如果你有正期望值的机会(如EV为正的投资),应该投入多少资金?

直觉答案:全部投入(最大化期望值)

正确答案:只投入部分(避免破产风险)

Kelly Criterion

f* = (bp - q) / b

其中:
f* = 最优投资比例
b = 赔率(赢时获得多少)
p = 胜率
q = 1 - p(败率)

例子:抛硬币赌博

  • 赢面朝上(60%):赢1倍投注
  • 输(40%):输掉投注
b = 1(赢1倍)
p = 0.6
q = 0.4

f* = (1 × 0.6 - 0.4) / 1
   = 0.2
   = 20%

最优策略:每次只投入总资金的20%

为什么不是100%?

情景A:全仓(100%)

假设有$100:
- 第1次赢(60%):$200
- 第1次输(40%):$0 → 破产,游戏结束

即使有60%胜率,40%概率你会破产。

情景B:凯利比例(20%)

假设有$100:
- 第1次赢(60%):$120
- 第1次输(40%):$80

即使连输3次(概率6.4%),还有$51,可以继续。

长期结果

凯利公式最大化对数期望增长率,兼顾:

  1. 利用正期望值
  2. 避免破产风险

巴菲特的应用

伯克希尔哈撒韦持仓:

  • 通常不会单一股票超过总仓位15%(接近凯利)
  • 即使对某公司非常看好,也分散风险

索普(Edward Thorp)的应用

数学家,21点高手,对冲基金经理。

  • 用凯利公式管理赌场资金(算牌)
  • 后来管理对冲基金(30年年化20%+)

启示

正期望值只是开始,仓位管理决定生死。

常见概率谬误

谬误1:小数定律(Law of Small Numbers)

错误信念:“样本规律=总体规律”

例子

某医院,某天出生10个婴儿,8个男孩。

新闻标题:“该医院男婴出生率异常高!”

真相

随机波动。小样本下,80%男孩完全正常(p=0.088,不显著)。

如果观察1000个婴儿,男孩比例会接近51%。

卡尼曼的研究

即使统计学家,也会高估小样本的代表性。

防范

永远问:“样本大小是多少?”

谬误2:赌徒谬误(Gambler’s Fallacy)

错误信念:“连续同一结果后,反向结果的概率增加”

例子

轮盘赌连续10次都是红色。

赌徒心想:“下一次肯定是黑色!"(因为"该轮到黑色了”)

真相

每次独立事件,概率不变(红色依然是47.37%)。

蒙特卡洛赌场,1913年

轮盘连续26次黑色。

赌徒疯狂下注红色(“这次一定是红!"),输了数百万法郎。

反向版本:热手谬误(Hot Hand Fallacy)

错误信念:“连续成功后,下次成功概率更高”

例子

篮球运动员连续投进3球。

队友传球给他:“他手感hot,这球必进!”

Gilovich et al. (1985)研究

分析NBA数据,热手不存在(统计上)。

连续投进3球后,下一球命中率 ≈ 平均命中率。

但人脑强烈感觉有热手(叙事谬误)。

谬误3:基础率忽略(Base Rate Neglect)

前面医疗检测的例子就是这个

再举一个:

场景

某城市有1000辆出租车:

  • 蓝色:850辆(85%)
  • 绿色:150辆(15%)

晚上发生车祸,目击者说是绿色出租车。

经测试,目击者在同样光线下识别准确率:80%

:肇事车是绿色的概率?

直觉答案:80%

正确答案(贝叶斯)

P(绿|说绿) = P(说绿|绿) × P(绿) / P(说绿)

P(说绿|绿) = 0.8
P(绿) = 0.15
P(说绿) = P(说绿|绿)×P(绿) + P(说绿|蓝)×P(蓝)
        = 0.8 × 0.15 + 0.2 × 0.85
        = 0.12 + 0.17
        = 0.29

P(绿|说绿) = (0.8 × 0.15) / 0.29
            ≈ 0.41
            = 41%

虽然目击者说是绿色,真实概率只有41%!

原因:绿色出租车太少(基础率低),所以即使目击准确,大部分"说是绿色"的情况其实来自蓝色(误判)。

防范

先问基础率,再看新证据。

深度反思:概率的哲学

两种概率观

频率学派(Frequentist)

概率 = 长期频率

“抛硬币正面概率50%“意味着:抛无穷多次,正面占50%。

特点

  • 客观
  • 需要重复实验
  • 不适合"一次性事件”(如"川普2024年胜选概率”)

贝叶斯学派(Bayesian)

概率 = 信念程度

“我认为这个假设有70%可能正确”

特点

  • 主观(每人可有不同概率)
  • 可以处理一次性事件
  • 随新证据更新(贝叶斯定理)

哪个对?

都对,看场景。

  • 质量控制:用频率(产品合格率)
  • 投资决策:用贝叶斯(这只股票涨的概率)

现代趋势:贝叶斯在AI、机器学习中主导。

概率vs确定性:哪个更真实?

量子力学的启示

海森堡不确定性原理:

Δx · Δp ≥ ℏ/2

我们无法同时精确知道粒子的位置和动量。

这不是测量技术问题,而是宇宙的根本属性

薛定谔的猫

在打开盒子之前,猫处于"50%活着+50%死亡"的叠加态。

启示

在最基本的物理层面,世界就是概率性的。

确定性是宏观幻觉。

经济学的复杂性

经济系统 > 量子系统的不确定性,因为:

  1. 反身性(Reflexivity):预测影响结果

    • 如果所有人都预测股市涨 → 大家买入 → 真的涨了
    • 预测不是旁观,而是参与
  2. 涌现性(Emergence):整体>部分之和

    • 理解每个人 ≠ 理解市场
    • 系统有自己的动力学
  3. 黑天鹅(Black Swan):极端事件不可预测

    • 2008金融危机
    • 新冠疫情

所以

拥抱概率思维不是退而求其次,而是更接近真相。


延伸阅读

  1. Annie Duke - Thinking in Bets

    • 扑克手的决策智慧
  2. Nate Silver - The Signal and the Noise

    • 预测的艺术与科学
  3. Philip Tetlock - Superforecasting

    • 如何成为超级预测者
  4. Leonard Mlodinow - The Drunkard’s Walk

    • 随机性如何主宰我们的生活

今日练习

练习1:校准训练(Calibration)

每天做10个预测,用概率表达:

例:

  • “明天我会在10点前起床”:80%
  • “下周团队会议我的提案通过”:60%
  • “今年公司营收达标”:40%

1个月后统计:

  • 你说80%的事情,实际发生了多少次?
  • 理想状态:说80%,真实发生也应该80%

如果偏差大

  • 说80%但只发生50% → 你过度自信
  • 说80%但发生90% → 你过度谨慎

调整,再训练。

练习2:贝叶斯更新

选一个你关心的假设(如"我应该换工作”)

先验概率:基于现有信息,你认为概率是多少?(如50%)

收集新证据

  • 和新公司HR聊(了解文化)
  • 问现员工(内部信息)
  • 研究行业前景

每次新证据后,更新概率

Week 1: 50% (基于薪水和职位)
Week 2: 65% (HR聊后,文化match)
Week 3: 45% (听说团队不稳定)
Week 4: 60% (行业前景好)
...

最终决策:基于后验概率,而非最初印象。

练习3:期望值计算

选一个决策(如投资、创业),列出:

情景概率结果(财务)结果(效用)
最好5%+$100万+10(人生巅峰)
较好20%+$20万+5(满意)
一般40%+$5万+1(还行)
较差25%-$2万-2(失望)
最差10%-$10万-8(崩溃)

计算

  • 财务期望值
  • 效用期望值

决策:如果财务EV为正但效用EV为负 → 不值得(因为风险厌恶)


明天预告:我们将深入贝叶斯推理的实践应用——从医疗诊断到商业决策,如何用数学更新你的信念。

“在上帝眼中,所有时刻都是当下,所有概率都是确定性。但我们不是上帝。我们必须在迷雾中行走,用概率作为手杖。”

—— 贝叶斯牧师(虚构引用,但精神一致)

“不是看对了多少次,而是看对的时候下注多少,看错的时候亏损多少。”

—— George Soros(索罗斯)