进化稳定策略:什么能长期存在?

引子:为什么善良的人没有被淘汰?

从进化论的角度看，一个困惑的问题:

如果"自私"更有利于生存(抢夺资源、不分享)，为什么人类社会中仍然有大量"利他"行为?

捐款给陌生人
志愿者无偿服务
见义勇为救助他人
分享知识不求回报

按照"适者生存"的逻辑:

自私者:保留所有资源给自己 → 生存率高 → 后代多
利他者:分享资源给他人 → 自己资源少 → 生存率低 → 后代少

长期来看,利他基因应该被淘汰,自私基因应该统治世界。

但现实不是这样!

答案在于:进化稳定策略(Evolutionarily Stable Strategy, ESS)

核心洞察:

不是"最强者"生存,而是"最稳定的策略组合"生存
在一个群体中,如果某种策略无法被其他策略入侵,它就是进化稳定的
纯粹的自私不稳定(会被背叛),纯粹的利他也不稳定(会被利用)
稳定的是:有条件的互惠(Tit-for-Tat)

“以牙还牙"策略(Tit-for-Tat):

第一次合作(释放善意)
之后:对方合作,你就合作;对方背叛,你就背叛
但允许宽恕:偶尔原谅对方的背叛,给第二次机会

这个策略在Robert Axelrod的"重复囚徒困境"计算机竞赛中,击败了所有更复杂的策略,成为冠军!

为什么稳定?

善良:吸引合作者
报复:惩罚背叛者
宽恕:避免陷入永久报复循环
简单:容易被理解和模仿

现实映射:

人类社会:合作是主流,但惩罚机制也存在(法律、道德谴责)
商业:长期合作伙伴关系,而非一次性欺诈
国际关系:互惠原则,而非永久敌对或永久妥协

今天,我们探讨进化稳定策略——什么样的策略能够长期存在,抵御入侵,成为主流?

一、什么是进化稳定策略?

1.1 ESS的定义

进化稳定策略(ESS): 在一个群体中,如果几乎所有成员都采用某种策略S,那么没有其他突变策略能够入侵这个群体(即:突变策略的表现不如S),则S是进化稳定策略。

简单说:

一种策略,一旦成为主流,就很难被其他策略取代
不一定是最优策略,但一定是稳定策略
类似于博弈论中的"纳什均衡”,但强调长期进化动态

数学定义(简化):

策略S是ESS,如果满足:

稳定条件1: S vs S的收益 ≥ 任何突变策略M vs S的收益
稳定条件2: 如果相等,则S vs M的收益 > M vs M的收益

含义:

如果突变者M出现在S主导的群体中:
- M遇到的大多数对手是S(因为S是主流)
- M vs S的表现要不差于S vs S
- 否则M会被淘汰
即使M vs S表现相同,M vs M的表现也要差于S vs S(M在同类中表现差,无法形成新主流)

1.2 经典模型:鹰鸽博弈(Hawk-Dove Game)

场景:两只鸟争夺食物

两种策略:

鹰(Hawk): 总是打架,直到一方受伤退出
鸽(Dove): 展示威胁,但对方强硬就退出

收益矩阵:

	对手是鸽	对手是鹰
我是鸽	平分资源:V/2	退出:0
我是鹰	独占资源:V	打架:平均(V-C)/2

假设:

V = 资源价值 = 10
C = 打架受伤成本 = 20

计算:

	对手是鸽	对手是鹰
我是鸽	5	0
我是鹰	10	-5

分析:

情况1:群体全是鸽

鸽 vs 鸽:平均收益 5
如果突变出一只鹰:
- 鹰 vs 鸽:收益 10
- 10 > 5,鹰的表现更好!
- 鹰会扩散,鸽不是ESS

情况2:群体全是鹰

鹰 vs 鹰:平均收益 -5(打架成本大于资源价值)
如果突变出一只鸽:
- 鸽 vs 鹰:收益 0
- 0 > -5,鸽的表现更好!
- 鸽会扩散,纯鹰不是ESS

稳定策略:混合策略

计算稳定比例: 设鹰的比例为p,鸽的比例为(1-p)

鹰的期望收益: E(鹰) = p × (-5) + (1-p) × 10 = 10 - 15p

鸽的期望收益: E(鸽) = p × 0 + (1-p) × 5 = 5 - 5p

稳定时,E(鹰) = E(鸽): 10 - 15p = 5 - 5p 10p = 5 p = 0.5

ESS:50%鹰,50%鸽

含义:

不是所有个体都鹰或都鸽
而是群体中鹰鸽各占一半
或者每个个体50%时候表现鹰,50%时候表现鸽
这个比例是稳定的:
- 如果鹰多了,打架成本增加,鹰不利,鸽增加
- 如果鸽多了,鹰有利,鹰增加
- 自动调节回50:50

商业映射:

鹰=激进竞争者(价格战、恶性竞争)
鸽=温和竞争者(理性竞争、合作共赢)
纯鹰:大家都打价格战,都亏损,不稳定
纯鸽:过于和平,容易被激进者掠夺,不稳定
稳定:部分激进+部分温和,动态平衡

二、商业中的进化稳定策略

2.1 案例:电商的价格策略

场景:多个电商平台竞争

两种策略:

低价策略: 价格战,薄利多销
高价策略: 保持价格,注重服务/品质

收益分析:

假设市场总规模固定:

	对手高价	对手低价
我高价	平分市场,高利润	失去市场,低收益
我低价	抢占市场,中等收益	价格战,低利润

具体数字(假设):

	对手高价	对手低价
我高价	100	20
我低价	150	30

分析:

纯高价不稳定:

如果大家都高价:收益100
突变者降价:收益150 > 100
降价者扩散,高价崩溃

纯低价不稳定(如果市场饱和):

如果大家都低价:收益30(价格战,利润薄)
突变者提价(差异化):服务小众高端市场,收益可能>30
在低价红海中,差异化有生存空间

现实:混合均衡

中国电商市场(2020):

淘宝/拼多多:低价策略(下沉市场)
天猫/京东:中高价策略(品质保证)
网易严选/小米有品:中等价格(性价比)

多种策略共存,形成生态平衡:

低价满足价格敏感用户
高价满足品质敏感用户
中档满足平衡需求

为什么稳定?

低价平台想提价:失去价格敏感用户,进入红海竞争,不利
高价平台想降价:损害品牌,而且打不过专业低价平台,不利
各自占据生态位,难以互相入侵

这是多策略ESS!

2.2 案例:互联网的开放vs封闭策略

两种策略:

开放策略: 开放API、数据、生态,允许第三方
封闭策略: 封闭系统,自己掌控,不给第三方

案例对比:

苹果(封闭):

iOS系统:
- 封闭:App必须通过App Store,苹果审核
- 不开放系统级API(如:NFC早期只给Apple Pay)
- 硬件软件深度集成

优势:
- 用户体验一致性
- 安全性高
- 高利润(30%抽成)

劣势:
- 开发者受限
- 创新受限(苹果不批准的就做不了)

安卓(开放):

Android系统:
- 开放:任何厂商可以定制
- 允许侧载App(不必通过Google Play)
- API开放度高

优势:
- 生态繁荣(各种定制版、App)
- 创新多样性
- 市场份额大

劣势:
- 体验碎片化
- 安全性相对弱
- Google利润率低(vs苹果)

ESS分析:

如果市场全是开放策略:

竞争激烈,利润薄
封闭策略突变者:提供高品质封闭体验,溢价,有市场(高端用户)
封闭策略可以入侵

如果市场全是封闭策略:

开发者/用户受限,不满
开放策略突变者:吸引大量开发者和自由用户
开放策略可以入侵

稳定态:两者共存

现实:

iOS(封闭):占据高端市场,约15-20%份额
Android(开放):占据大众市场,约80-85%份额

两者共存,互不取代:

苹果:服务高端用户,高利润,稳定
安卓:服务大众用户,高份额,稳定
各自的用户群对另一方不感兴趣,难以切换

这是ESS的多样性均衡!

2.3 案例:企业文化的策略

两种极端文化:

狼性文化: 高强度、高竞争、高淘汰(如:华为、字节早期)
温和文化: 平衡、稳定、低压力(如:某些外企、国企)

收益矩阵(简化):

	市场竞争激烈	市场平稳
狼性文化	高增长,但员工流失率高	过度内耗,不必要压力
温和文化	反应慢,被淘汰风险	稳定发展,员工满意度高

ESS分析:

环境决定稳定策略:

激烈竞争环境(如:移动互联网早期):

狼性文化:快速迭代、加班、高强度 → 适应环境 → 胜出
温和文化:反应慢、朝九晚五 → 不适应 → 被淘汰
ESS:狼性文化主导

平稳环境(如:传统行业成熟期):

狼性文化:员工累、流失高、不必要内耗 → 不经济
温和文化:稳定、经验积累、低流失 → 更适应
ESS:温和文化主导

现实:行业分化

互联网/创业公司:
- 多为狼性文化(环境需要)
- 如:字节跳动的"context not control"、高强度

传统企业/成熟公司:
- 多为温和文化(环境允许)
- 如:宝洁、联合利华的稳定节奏

各自稳定,因为环境不同!

动态调整:

有些公司随环境变化调整策略:

微软:
- 鲍尔默时代(2000-2014):stack ranking,内部竞争,狼性
- 纳德拉时代(2014-):成长型思维,合作,温和
- 为什么?
  * 早期:PC市场竞争激烈,需要狼性
  * 后期:云计算需要合作创新,过度竞争有害
  * 策略调整,适应新环境

结果:市值从2014年3000亿 → 2020年1.5万亿,成功!

关键:ESS不是固定的,随环境变化而变化!

三、ESS的实践框架

3.1 识别当前环境的ESS

步骤1:观察主流策略

在你的行业/市场,主流玩家采用什么策略?

示例:短视频行业(2020)
- 抖音:算法推荐,中心化分发
- 快手:社区推荐,去中心化
- B站:UP主生态,粉丝关系

主流策略:算法推荐为主(抖音占优)

步骤2:分析为什么这个策略稳定

问:为什么这个策略成为主流?

抖音的算法推荐:
- 用户视角:内容精准,停留时间长
- 创作者视角:爆款机会(vs 粉丝制,新人难出头)
- 平台视角:中心化控制,商业化容易

为什么稳定?
- 用户习惯算法喂养,切换到关注制不适应
- 创作者依赖算法分发,自建粉丝成本高
- 平台规模效应,数据越多,算法越准

正反馈 → 稳定

步骤3:思考突变策略的入侵可能性

问:有没有其他策略可能颠覆现有ESS?

假设突变策略:强社交关系推荐
- 模式:好友推荐内容,而非算法
- 优势:信任度高,社交黏性
- 案例:微信视频号(基于社交关系)

能否入侵抖音的ESS?
- 短期:难(用户已习惯算法,社交关系推荐内容不够多样)
- 长期:可能(如果用户对算法茧房厌倦,社交推荐有机会)

环境变化(用户需求变化)可能改变ESS!

3.2 设计你的进化稳定策略

目标:找到一个策略,竞争对手难以模仿/入侵

策略类型:

1. 壁垒型ESS

建立高门槛,别人进不来

示例:特斯拉的充电网络
- 自建数万充电桩(投入数十亿)
- 竞争对手:要么巨额投入追赶(成本高),要么放弃(体验差)
- 特斯拉先发优势 → 网络效应 → 难以入侵

稳定性:资本壁垒 + 网络效应

2. 生态位型ESS

占据独特生态位,避免正面竞争

示例:B站的二次元/学习生态
- 不和抖音拼泛娱乐(打不过)
- 专注年轻人的特定兴趣圈层
- 形成独特社区文化

稳定性:
- 想进入B站的用户画像?要懂二次元文化(门槛)
- 抖音用户对B站不感兴趣,B站用户对抖音泛娱乐不满意
- 各自稳定

这是多样性ESS:不同策略占据不同生态位,共存

3. 动态适应型ESS

不是固定策略,而是快速适应能力

示例:字节跳动的产品矩阵
- 不押注单一产品策略
- 而是:快速试错,动态调整
- 抖音成功 → 加倍投入
- 多闪失败 → 快速止损

稳定性:不是某个产品稳定,而是"快速适应"这个能力稳定
- 竞争对手:速度慢,跟不上
- 字节:环境变化时,快速调整,持续适应

这是元策略ESS:策略的策略

3.3 测试你的策略是否ESS

测试1:抗入侵测试

问:如果竞争对手模仿我的策略,我还有优势吗?

示例:拼多多的低价策略
- 如果淘宝也做低价(聚划算、淘特):
  * 拼多多还有优势吗?
  * 优势:社交拼团(淘宝没有)、下沉市场心智(先发)
  * 淘宝劣势:品牌定位冲突(天猫高端vs淘特低端)

测试结果:拼多多的策略有一定ESS(不是完全,但有防御)

如果竞争对手模仿,你优势全失 → 策略不是ESS,需要加强壁垒!

测试2:环境变化测试

问:如果环境变化(技术、政策、用户需求),我的策略还稳定吗?

示例:滴滴的补贴策略
- 早期:补贴用户和司机,快速占领市场
- 稳定吗?
  * 如果:资本寒冬,融资困难 → 补贴无法持续 → 不稳定
  * 如果:政策监管,禁止补贴 → 策略失效 → 不稳定

教训:纯补贴不是ESS(依赖外部资源)

ESS策略:自我强化,不依赖持续外部输入
- 网络效应:用户多→司机多→用户更多(自我强化)✓
- 品牌心智:大家想打车就想到滴滴(自我强化)✓

滴滴后期:从补贴 → 网络效应 + 品牌,转向ESS

测试3:多策略共存测试

问:市场能否容纳多种策略共存?还是赢家通吃?

赢家通吃行业(单一ESS):
- 社交网络:微信一家独大(网络效应极强)
- 搜索引擎:百度主导(数据飞轮效应)
- 在这些领域,很难有多策略ESS

多策略共存行业(多样ESS):
- 电商:淘宝(C2C)、京东(B2C)、拼多多(社交)、唯品会(特卖)共存
- 视频:长视频(爱优腾)、中视频(B站)、短视频(抖快)共存
- 原因:用户需求多样,不同策略满足不同需求

识别你的行业是哪种?
- 赢家通吃:必须成为那个唯一的策略,否则死
- 多样共存:找到独特生态位,和其他策略共存

不同行业,ESS动态不同!

四、ESS的高级概念

4.1 条件策略(Conditional Strategy)

定义:根据环境/对手不同,采用不同策略

示例:“以牙还牙”(Tit-for-Tat)

不是固定的"总是合作"或"总是背叛"
而是:
- 首次:合作
- 之后:对方合作→我合作;对方背叛→我背叛
- 偶尔:原谅(避免永久报复)

为什么是ESS?
- vs 总是合作者(傻瓜):我合作,建立互利关系,双赢
- vs 总是背叛者(恶人):我报复,他占不到便宜,他也不利

"以牙还牙"在各种对手中都表现不差,难以被入侵

商业应用:合作伙伴关系
- 首次:给予信任,合作
- 对方守信:继续合作,深化关系
- 对方违约:报复(停止合作,甚至法律诉讼)
- 但:如果对方道歉+补偿,可以原谅,恢复合作

这是长期稳定的商业策略!

4.2 频率依赖选择(Frequency-Dependent Selection)

定义:策略的适应度取决于群体中该策略的频率

示例:左撇子 vs 右撇子(体育)

现实:
- 人类约90%右撇子,10%左撇子
- 为什么左撇子没有被淘汰?(如果右撇子更优)

答案:负频率依赖
- 如果左撇子很少(如10%):
  * 对手不习惯对付左撇子 → 左撇子有优势
  * 左撇子比例上升
- 如果左撇子多了(如50%):
  * 对手都习惯了 → 左撇子优势下降
  * 左撇子比例下降

稳定点:约10%(左撇子有优势,但不是多数)

商业类比:创新策略
- 如果大家都守旧:创新者有巨大优势(蓝海)
- 如果大家都创新:创新优势下降,甚至内耗
- 稳定:大部分守旧,少数创新(10-20%)

这解释了为什么颠覆性创新者总是少数!

4.3 红皇后效应(Red Queen Effect)

出自《爱丽丝镜中奇遇记》:

“在这个地方,你必须不停地奔跑,才能保持在原地。”

定义:竞争双方都在进化,你必须持续进化才能不被淘汰

示例:病毒 vs 免疫系统

病毒:不断变异,逃避免疫系统
免疫系统:不断进化,识别新病毒

双方军备竞赛:
- 病毒进化 → 免疫系统进化 → 病毒再进化 → ...
- 没有终点,必须持续进化

结果:不是达到稳定均衡,而是动态共同进化

商业应用:技术军备竞赛

示例:手机性能大战
- 厂商A:推出6GB RAM手机
- 厂商B:推出8GB RAM
- 厂商A:推出12GB RAM
- ...

消费者需要12GB吗?可能不需要
但:如果你不跟进,就显得落后

红皇后效应:
- 大家都在进化
- 你也必须进化
- 不是为了变好,而是为了不被甩开

这不是ESS(没有稳定点),而是持续进化的动态

应对策略:

不参与军备竞赛:
- 找到不同维度竞争(如:苹果不拼参数,拼体验)
- 或:退出这个赛道

参与军备竞赛:
- 确保有持续投入能力
- 否则中途掉队,被淘汰

选择哪种?取决于资源和战略定位

五、实践练习

练习1:分析你所在行业的ESS

步骤:

1. 列出行业主要玩家和他们的策略

   示例(咖啡行业):
   - 星巴克:第三空间,高端体验
   - 瑞幸:快速便捷,性价比
   - Manner:精品咖啡,小而美

2. 分析各策略为什么稳定

   星巴克:
   - 品牌溢价,用户愿意为"空间"付费
   - 规模效应,全球采购降低成本
   - 路径依赖,用户习惯

   瑞幸:
   - 互联网运营,效率高
   - 补贴获客,外卖为主
   - (财务造假后重建,策略调整为真性价比)

3. 思考是否有新策略可以入侵

   可能的突变策略:
   - 超低价速溶咖啡?(已有,但市场不同)
   - 家庭咖啡机订阅服务?(Nespresso模式)
   - ...

4. 判断:多策略ESS还是单一ESS?

   咖啡:多策略ESS
   - 不同用户群:商务(星巴克)、白领(瑞幸)、咖啡爱好者(精品)
   - 各占生态位,共存

练习2:设计你的ESS

场景:你要推出一个新产品

问题:

1. 市场现有主流策略是什么?
2. 你的差异化策略是什么?
3. 为什么这个策略难以被模仿/入侵?(护城河)
4. 如果环境变化,你的策略还稳定吗?

示例(假设做在线教育):

1. 现有策略:
   - 猿辅导、作业帮:题库+直播大班课
   - VIPKID:1对1外教
   - 学而思:录播课+辅导老师

2. 我的策略:
   - AI个性化学习路径 + 小班课(10人)
   - 差异点:
     * vs 大班课:个性化,效果好
     * vs 1对1:成本低,更多互动

3. 护城河:
   - 技术:AI算法积累(数据飞轮)
   - 师资:小班课教师培养体系
   - 用户习惯:学习数据积累,切换成本高

4. 环境变化:
   - 如果:政策限制在线教育(2021双减)→ 策略失效
   - 应对:提前布局成人教育、素质教育(政策风险低)

设计时考虑ESS,不只是"差异化",还要"可防御"!

练习3:识别不稳定策略

看以下策略,哪些不是ESS?为什么?

A. 纯补贴获客(滴滴早期、瑞幸早期)
B. 网络效应(微信、淘宝)
C. 技术领先(但无专利保护)
D. 品牌溢价(苹果、爱马仕)

分析:

A. 纯补贴:不是ESS
- 依赖外部资金输入
- 资金断裂,策略崩溃
- 竞争对手也补贴,军备竞赛
- 不可持续

B. 网络效应:是ESS
- 自我强化(用户越多,价值越大,更多用户)
- 不依赖外部输入
- 竞争对手难以入侵(冷启动困难)

C. 技术领先(无专利):不是ESS
- 技术可以被模仿(6-12个月)
- 领先优势消失
- 除非:技术迭代速度快,保持领先(变成动态ESS)

D. 品牌溢价:是ESS(长期积累型)
- 品牌是长期投入积累
- 竞争对手短期模仿不了
- 用户心智锁定
- 但:需要持续维护

启示:
- 真正的ESS不依赖外部持续输入
- 而是自我强化,或者高壁垒

六、总结

进化稳定策略(ESS)告诉我们:

核心原理:

稳定>最优: 不是最好的策略,而是最稳定的策略能长期存在
抗入侵性: ESS能抵抗突变策略的入侵
环境依赖: 稳定策略随环境变化而变化
多样性: 可能存在多个ESS共存(占据不同生态位)

商业应用:

识别ESS: 观察行业主流策略,理解为什么稳定
设计ESS: 建立难以入侵的策略(壁垒、生态位、动态适应)
测试ESS: 抗入侵测试、环境变化测试
动态调整: 环境变化时,调整策略,保持稳定

关键策略类型:

壁垒型: 高门槛(资本、技术、网络效应)
生态位型: 占据独特位置,避免正面竞争
动态型: 快速适应能力成为稳定优势
条件型: 根据环境/对手调整(如:以牙还牙)

常见陷阱:

追求最优而非稳定(过度优化,缺乏韧性)
忽视环境变化(策略锁定,难以调整)
参与不必要的军备竞赛(红皇后效应)

关键洞察:

长期存在≠最强,而是最稳定、最难被取代。

在商业竞争中:

不是做到最好(容易被模仿)
而是建立稳定优势(难以入侵)
在变化中保持适应(动态ESS)

理解ESS,就能理解:

为什么某些商业模式长盛不衰
为什么某些创新难以颠覆现有玩家
什么样的策略能够长期生存

明天,我们将完成进化思维周,总结整合本周内容。

今日思考:你的产品/策略,是进化稳定的吗?如果竞争对手模仿,你还有优势吗?如果环境变化,你还稳定吗?

引子:为什么善良的人没有被淘汰?#

一、什么是进化稳定策略?#

1.1 ESS的定义#

1.2 经典模型:鹰鸽博弈(Hawk-Dove Game)#

二、商业中的进化稳定策略#

2.1 案例:电商的价格策略#

2.2 案例:互联网的开放vs封闭策略#

2.3 案例:企业文化的策略#

三、ESS的实践框架#

3.1 识别当前环境的ESS#

3.2 设计你的进化稳定策略#

3.3 测试你的策略是否ESS#

四、ESS的高级概念#

4.1 条件策略(Conditional Strategy)#

4.2 频率依赖选择(Frequency-Dependent Selection)#

4.3 红皇后效应(Red Queen Effect)#

五、实践练习#

练习1:分析你所在行业的ESS#

练习2:设计你的ESS#

练习3:识别不稳定策略#

六、总结#

引子:为什么善良的人没有被淘汰?

一、什么是进化稳定策略?

1.1 ESS的定义

1.2 经典模型:鹰鸽博弈(Hawk-Dove Game)

二、商业中的进化稳定策略

2.1 案例:电商的价格策略

2.2 案例:互联网的开放vs封闭策略

2.3 案例:企业文化的策略

三、ESS的实践框架

3.1 识别当前环境的ESS

3.2 设计你的进化稳定策略

3.3 测试你的策略是否ESS

四、ESS的高级概念

4.1 条件策略(Conditional Strategy)

4.2 频率依赖选择(Frequency-Dependent Selection)

4.3 红皇后效应(Red Queen Effect)

五、实践练习

练习1:分析你所在行业的ESS

练习2:设计你的ESS

练习3:识别不稳定策略

六、总结