引子:为什么善良的人没有被淘汰?
从进化论的角度看,一个困惑的问题:
如果"自私"更有利于生存(抢夺资源、不分享),为什么人类社会中仍然有大量"利他"行为?
- 捐款给陌生人
- 志愿者无偿服务
- 见义勇为救助他人
- 分享知识不求回报
按照"适者生存"的逻辑:
- 自私者:保留所有资源给自己 → 生存率高 → 后代多
- 利他者:分享资源给他人 → 自己资源少 → 生存率低 → 后代少
长期来看,利他基因应该被淘汰,自私基因应该统治世界。
但现实不是这样!
答案在于:进化稳定策略(Evolutionarily Stable Strategy, ESS)
核心洞察:
- 不是"最强者"生存,而是"最稳定的策略组合"生存
- 在一个群体中,如果某种策略无法被其他策略入侵,它就是进化稳定的
- 纯粹的自私不稳定(会被背叛),纯粹的利他也不稳定(会被利用)
- 稳定的是:有条件的互惠(Tit-for-Tat)
“以牙还牙"策略(Tit-for-Tat):
- 第一次合作(释放善意)
- 之后:对方合作,你就合作;对方背叛,你就背叛
- 但允许宽恕:偶尔原谅对方的背叛,给第二次机会
这个策略在Robert Axelrod的"重复囚徒困境"计算机竞赛中,击败了所有更复杂的策略,成为冠军!
为什么稳定?
- 善良:吸引合作者
- 报复:惩罚背叛者
- 宽恕:避免陷入永久报复循环
- 简单:容易被理解和模仿
现实映射:
- 人类社会:合作是主流,但惩罚机制也存在(法律、道德谴责)
- 商业:长期合作伙伴关系,而非一次性欺诈
- 国际关系:互惠原则,而非永久敌对或永久妥协
今天,我们探讨进化稳定策略——什么样的策略能够长期存在,抵御入侵,成为主流?
一、什么是进化稳定策略?
1.1 ESS的定义
进化稳定策略(ESS): 在一个群体中,如果几乎所有成员都采用某种策略S,那么没有其他突变策略能够入侵这个群体(即:突变策略的表现不如S),则S是进化稳定策略。
简单说:
- 一种策略,一旦成为主流,就很难被其他策略取代
- 不一定是最优策略,但一定是稳定策略
- 类似于博弈论中的"纳什均衡”,但强调长期进化动态
数学定义(简化):
策略S是ESS,如果满足:
- 稳定条件1: S vs S的收益 ≥ 任何突变策略M vs S的收益
- 稳定条件2: 如果相等,则S vs M的收益 > M vs M的收益
含义:
- 如果突变者M出现在S主导的群体中:
- M遇到的大多数对手是S(因为S是主流)
- M vs S的表现要不差于S vs S
- 否则M会被淘汰
- 即使M vs S表现相同,M vs M的表现也要差于S vs S(M在同类中表现差,无法形成新主流)
1.2 经典模型:鹰鸽博弈(Hawk-Dove Game)
场景:两只鸟争夺食物
两种策略:
- 鹰(Hawk): 总是打架,直到一方受伤退出
- 鸽(Dove): 展示威胁,但对方强硬就退出
收益矩阵:
| 对手是鸽 | 对手是鹰 | |
|---|---|---|
| 我是鸽 | 平分资源:V/2 | 退出:0 |
| 我是鹰 | 独占资源:V | 打架:平均(V-C)/2 |
假设:
- V = 资源价值 = 10
- C = 打架受伤成本 = 20
计算:
| 对手是鸽 | 对手是鹰 | |
|---|---|---|
| 我是鸽 | 5 | 0 |
| 我是鹰 | 10 | -5 |
分析:
情况1:群体全是鸽
- 鸽 vs 鸽:平均收益 5
- 如果突变出一只鹰:
- 鹰 vs 鸽:收益 10
- 10 > 5,鹰的表现更好!
- 鹰会扩散,鸽不是ESS
情况2:群体全是鹰
- 鹰 vs 鹰:平均收益 -5(打架成本大于资源价值)
- 如果突变出一只鸽:
- 鸽 vs 鹰:收益 0
- 0 > -5,鸽的表现更好!
- 鸽会扩散,纯鹰不是ESS
稳定策略:混合策略
计算稳定比例: 设鹰的比例为p,鸽的比例为(1-p)
鹰的期望收益: E(鹰) = p × (-5) + (1-p) × 10 = 10 - 15p
鸽的期望收益: E(鸽) = p × 0 + (1-p) × 5 = 5 - 5p
稳定时,E(鹰) = E(鸽): 10 - 15p = 5 - 5p 10p = 5 p = 0.5
ESS:50%鹰,50%鸽
含义:
- 不是所有个体都鹰或都鸽
- 而是群体中鹰鸽各占一半
- 或者每个个体50%时候表现鹰,50%时候表现鸽
- 这个比例是稳定的:
- 如果鹰多了,打架成本增加,鹰不利,鸽增加
- 如果鸽多了,鹰有利,鹰增加
- 自动调节回50:50
商业映射:
- 鹰=激进竞争者(价格战、恶性竞争)
- 鸽=温和竞争者(理性竞争、合作共赢)
- 纯鹰:大家都打价格战,都亏损,不稳定
- 纯鸽:过于和平,容易被激进者掠夺,不稳定
- 稳定:部分激进+部分温和,动态平衡
二、商业中的进化稳定策略
2.1 案例:电商的价格策略
场景:多个电商平台竞争
两种策略:
- 低价策略: 价格战,薄利多销
- 高价策略: 保持价格,注重服务/品质
收益分析:
假设市场总规模固定:
| 对手高价 | 对手低价 | |
|---|---|---|
| 我高价 | 平分市场,高利润 | 失去市场,低收益 |
| 我低价 | 抢占市场,中等收益 | 价格战,低利润 |
具体数字(假设):
| 对手高价 | 对手低价 | |
|---|---|---|
| 我高价 | 100 | 20 |
| 我低价 | 150 | 30 |
分析:
纯高价不稳定:
- 如果大家都高价:收益100
- 突变者降价:收益150 > 100
- 降价者扩散,高价崩溃
纯低价不稳定(如果市场饱和):
- 如果大家都低价:收益30(价格战,利润薄)
- 突变者提价(差异化):服务小众高端市场,收益可能>30
- 在低价红海中,差异化有生存空间
现实:混合均衡
中国电商市场(2020):
- 淘宝/拼多多:低价策略(下沉市场)
- 天猫/京东:中高价策略(品质保证)
- 网易严选/小米有品:中等价格(性价比)
多种策略共存,形成生态平衡:
- 低价满足价格敏感用户
- 高价满足品质敏感用户
- 中档满足平衡需求
为什么稳定?
- 低价平台想提价:失去价格敏感用户,进入红海竞争,不利
- 高价平台想降价:损害品牌,而且打不过专业低价平台,不利
- 各自占据生态位,难以互相入侵
这是多策略ESS!
2.2 案例:互联网的开放vs封闭策略
两种策略:
- 开放策略: 开放API、数据、生态,允许第三方
- 封闭策略: 封闭系统,自己掌控,不给第三方
案例对比:
苹果(封闭):
iOS系统:
- 封闭:App必须通过App Store,苹果审核
- 不开放系统级API(如:NFC早期只给Apple Pay)
- 硬件软件深度集成
优势:
- 用户体验一致性
- 安全性高
- 高利润(30%抽成)
劣势:
- 开发者受限
- 创新受限(苹果不批准的就做不了)
安卓(开放):
Android系统:
- 开放:任何厂商可以定制
- 允许侧载App(不必通过Google Play)
- API开放度高
优势:
- 生态繁荣(各种定制版、App)
- 创新多样性
- 市场份额大
劣势:
- 体验碎片化
- 安全性相对弱
- Google利润率低(vs苹果)
ESS分析:
如果市场全是开放策略:
- 竞争激烈,利润薄
- 封闭策略突变者:提供高品质封闭体验,溢价,有市场(高端用户)
- 封闭策略可以入侵
如果市场全是封闭策略:
- 开发者/用户受限,不满
- 开放策略突变者:吸引大量开发者和自由用户
- 开放策略可以入侵
稳定态:两者共存
现实:
- iOS(封闭):占据高端市场,约15-20%份额
- Android(开放):占据大众市场,约80-85%份额
两者共存,互不取代:
- 苹果:服务高端用户,高利润,稳定
- 安卓:服务大众用户,高份额,稳定
- 各自的用户群对另一方不感兴趣,难以切换
这是ESS的多样性均衡!
2.3 案例:企业文化的策略
两种极端文化:
- 狼性文化: 高强度、高竞争、高淘汰(如:华为、字节早期)
- 温和文化: 平衡、稳定、低压力(如:某些外企、国企)
收益矩阵(简化):
| 市场竞争激烈 | 市场平稳 | |
|---|---|---|
| 狼性文化 | 高增长,但员工流失率高 | 过度内耗,不必要压力 |
| 温和文化 | 反应慢,被淘汰风险 | 稳定发展,员工满意度高 |
ESS分析:
环境决定稳定策略:
激烈竞争环境(如:移动互联网早期):
- 狼性文化:快速迭代、加班、高强度 → 适应环境 → 胜出
- 温和文化:反应慢、朝九晚五 → 不适应 → 被淘汰
- ESS:狼性文化主导
平稳环境(如:传统行业成熟期):
- 狼性文化:员工累、流失高、不必要内耗 → 不经济
- 温和文化:稳定、经验积累、低流失 → 更适应
- ESS:温和文化主导
现实:行业分化
互联网/创业公司:
- 多为狼性文化(环境需要)
- 如:字节跳动的"context not control"、高强度
传统企业/成熟公司:
- 多为温和文化(环境允许)
- 如:宝洁、联合利华的稳定节奏
各自稳定,因为环境不同!
动态调整:
有些公司随环境变化调整策略:
微软:
- 鲍尔默时代(2000-2014):stack ranking,内部竞争,狼性
- 纳德拉时代(2014-):成长型思维,合作,温和
- 为什么?
* 早期:PC市场竞争激烈,需要狼性
* 后期:云计算需要合作创新,过度竞争有害
* 策略调整,适应新环境
结果:市值从2014年3000亿 → 2020年1.5万亿,成功!
关键:ESS不是固定的,随环境变化而变化!
三、ESS的实践框架
3.1 识别当前环境的ESS
步骤1:观察主流策略
在你的行业/市场,主流玩家采用什么策略?
示例:短视频行业(2020)
- 抖音:算法推荐,中心化分发
- 快手:社区推荐,去中心化
- B站:UP主生态,粉丝关系
主流策略:算法推荐为主(抖音占优)
步骤2:分析为什么这个策略稳定
问:为什么这个策略成为主流?
抖音的算法推荐:
- 用户视角:内容精准,停留时间长
- 创作者视角:爆款机会(vs 粉丝制,新人难出头)
- 平台视角:中心化控制,商业化容易
为什么稳定?
- 用户习惯算法喂养,切换到关注制不适应
- 创作者依赖算法分发,自建粉丝成本高
- 平台规模效应,数据越多,算法越准
正反馈 → 稳定
步骤3:思考突变策略的入侵可能性
问:有没有其他策略可能颠覆现有ESS?
假设突变策略:强社交关系推荐
- 模式:好友推荐内容,而非算法
- 优势:信任度高,社交黏性
- 案例:微信视频号(基于社交关系)
能否入侵抖音的ESS?
- 短期:难(用户已习惯算法,社交关系推荐内容不够多样)
- 长期:可能(如果用户对算法茧房厌倦,社交推荐有机会)
环境变化(用户需求变化)可能改变ESS!
3.2 设计你的进化稳定策略
目标:找到一个策略,竞争对手难以模仿/入侵
策略类型:
1. 壁垒型ESS
建立高门槛,别人进不来
示例:特斯拉的充电网络
- 自建数万充电桩(投入数十亿)
- 竞争对手:要么巨额投入追赶(成本高),要么放弃(体验差)
- 特斯拉先发优势 → 网络效应 → 难以入侵
稳定性:资本壁垒 + 网络效应
2. 生态位型ESS
占据独特生态位,避免正面竞争
示例:B站的二次元/学习生态
- 不和抖音拼泛娱乐(打不过)
- 专注年轻人的特定兴趣圈层
- 形成独特社区文化
稳定性:
- 想进入B站的用户画像?要懂二次元文化(门槛)
- 抖音用户对B站不感兴趣,B站用户对抖音泛娱乐不满意
- 各自稳定
这是多样性ESS:不同策略占据不同生态位,共存
3. 动态适应型ESS
不是固定策略,而是快速适应能力
示例:字节跳动的产品矩阵
- 不押注单一产品策略
- 而是:快速试错,动态调整
- 抖音成功 → 加倍投入
- 多闪失败 → 快速止损
稳定性:不是某个产品稳定,而是"快速适应"这个能力稳定
- 竞争对手:速度慢,跟不上
- 字节:环境变化时,快速调整,持续适应
这是元策略ESS:策略的策略
3.3 测试你的策略是否ESS
测试1:抗入侵测试
问:如果竞争对手模仿我的策略,我还有优势吗?
示例:拼多多的低价策略
- 如果淘宝也做低价(聚划算、淘特):
* 拼多多还有优势吗?
* 优势:社交拼团(淘宝没有)、下沉市场心智(先发)
* 淘宝劣势:品牌定位冲突(天猫高端vs淘特低端)
测试结果:拼多多的策略有一定ESS(不是完全,但有防御)
如果竞争对手模仿,你优势全失 → 策略不是ESS,需要加强壁垒!
测试2:环境变化测试
问:如果环境变化(技术、政策、用户需求),我的策略还稳定吗?
示例:滴滴的补贴策略
- 早期:补贴用户和司机,快速占领市场
- 稳定吗?
* 如果:资本寒冬,融资困难 → 补贴无法持续 → 不稳定
* 如果:政策监管,禁止补贴 → 策略失效 → 不稳定
教训:纯补贴不是ESS(依赖外部资源)
ESS策略:自我强化,不依赖持续外部输入
- 网络效应:用户多→司机多→用户更多(自我强化)✓
- 品牌心智:大家想打车就想到滴滴(自我强化)✓
滴滴后期:从补贴 → 网络效应 + 品牌,转向ESS
测试3:多策略共存测试
问:市场能否容纳多种策略共存?还是赢家通吃?
赢家通吃行业(单一ESS):
- 社交网络:微信一家独大(网络效应极强)
- 搜索引擎:百度主导(数据飞轮效应)
- 在这些领域,很难有多策略ESS
多策略共存行业(多样ESS):
- 电商:淘宝(C2C)、京东(B2C)、拼多多(社交)、唯品会(特卖)共存
- 视频:长视频(爱优腾)、中视频(B站)、短视频(抖快)共存
- 原因:用户需求多样,不同策略满足不同需求
识别你的行业是哪种?
- 赢家通吃:必须成为那个唯一的策略,否则死
- 多样共存:找到独特生态位,和其他策略共存
不同行业,ESS动态不同!
四、ESS的高级概念
4.1 条件策略(Conditional Strategy)
定义:根据环境/对手不同,采用不同策略
示例:“以牙还牙”(Tit-for-Tat)
不是固定的"总是合作"或"总是背叛"
而是:
- 首次:合作
- 之后:对方合作→我合作;对方背叛→我背叛
- 偶尔:原谅(避免永久报复)
为什么是ESS?
- vs 总是合作者(傻瓜):我合作,建立互利关系,双赢
- vs 总是背叛者(恶人):我报复,他占不到便宜,他也不利
"以牙还牙"在各种对手中都表现不差,难以被入侵
商业应用:合作伙伴关系
- 首次:给予信任,合作
- 对方守信:继续合作,深化关系
- 对方违约:报复(停止合作,甚至法律诉讼)
- 但:如果对方道歉+补偿,可以原谅,恢复合作
这是长期稳定的商业策略!
4.2 频率依赖选择(Frequency-Dependent Selection)
定义:策略的适应度取决于群体中该策略的频率
示例:左撇子 vs 右撇子(体育)
现实:
- 人类约90%右撇子,10%左撇子
- 为什么左撇子没有被淘汰?(如果右撇子更优)
答案:负频率依赖
- 如果左撇子很少(如10%):
* 对手不习惯对付左撇子 → 左撇子有优势
* 左撇子比例上升
- 如果左撇子多了(如50%):
* 对手都习惯了 → 左撇子优势下降
* 左撇子比例下降
稳定点:约10%(左撇子有优势,但不是多数)
商业类比:创新策略
- 如果大家都守旧:创新者有巨大优势(蓝海)
- 如果大家都创新:创新优势下降,甚至内耗
- 稳定:大部分守旧,少数创新(10-20%)
这解释了为什么颠覆性创新者总是少数!
4.3 红皇后效应(Red Queen Effect)
出自《爱丽丝镜中奇遇记》:
“在这个地方,你必须不停地奔跑,才能保持在原地。”
定义:竞争双方都在进化,你必须持续进化才能不被淘汰
示例:病毒 vs 免疫系统
病毒:不断变异,逃避免疫系统
免疫系统:不断进化,识别新病毒
双方军备竞赛:
- 病毒进化 → 免疫系统进化 → 病毒再进化 → ...
- 没有终点,必须持续进化
结果:不是达到稳定均衡,而是动态共同进化
商业应用:技术军备竞赛
示例:手机性能大战
- 厂商A:推出6GB RAM手机
- 厂商B:推出8GB RAM
- 厂商A:推出12GB RAM
- ...
消费者需要12GB吗?可能不需要
但:如果你不跟进,就显得落后
红皇后效应:
- 大家都在进化
- 你也必须进化
- 不是为了变好,而是为了不被甩开
这不是ESS(没有稳定点),而是持续进化的动态
应对策略:
不参与军备竞赛:
- 找到不同维度竞争(如:苹果不拼参数,拼体验)
- 或:退出这个赛道
参与军备竞赛:
- 确保有持续投入能力
- 否则中途掉队,被淘汰
选择哪种?取决于资源和战略定位
五、实践练习
练习1:分析你所在行业的ESS
步骤:
1. 列出行业主要玩家和他们的策略
示例(咖啡行业):
- 星巴克:第三空间,高端体验
- 瑞幸:快速便捷,性价比
- Manner:精品咖啡,小而美
2. 分析各策略为什么稳定
星巴克:
- 品牌溢价,用户愿意为"空间"付费
- 规模效应,全球采购降低成本
- 路径依赖,用户习惯
瑞幸:
- 互联网运营,效率高
- 补贴获客,外卖为主
- (财务造假后重建,策略调整为真性价比)
3. 思考是否有新策略可以入侵
可能的突变策略:
- 超低价速溶咖啡?(已有,但市场不同)
- 家庭咖啡机订阅服务?(Nespresso模式)
- ...
4. 判断:多策略ESS还是单一ESS?
咖啡:多策略ESS
- 不同用户群:商务(星巴克)、白领(瑞幸)、咖啡爱好者(精品)
- 各占生态位,共存
练习2:设计你的ESS
场景:你要推出一个新产品
问题:
1. 市场现有主流策略是什么?
2. 你的差异化策略是什么?
3. 为什么这个策略难以被模仿/入侵?(护城河)
4. 如果环境变化,你的策略还稳定吗?
示例(假设做在线教育):
1. 现有策略:
- 猿辅导、作业帮:题库+直播大班课
- VIPKID:1对1外教
- 学而思:录播课+辅导老师
2. 我的策略:
- AI个性化学习路径 + 小班课(10人)
- 差异点:
* vs 大班课:个性化,效果好
* vs 1对1:成本低,更多互动
3. 护城河:
- 技术:AI算法积累(数据飞轮)
- 师资:小班课教师培养体系
- 用户习惯:学习数据积累,切换成本高
4. 环境变化:
- 如果:政策限制在线教育(2021双减)→ 策略失效
- 应对:提前布局成人教育、素质教育(政策风险低)
设计时考虑ESS,不只是"差异化",还要"可防御"!
练习3:识别不稳定策略
看以下策略,哪些不是ESS?为什么?
A. 纯补贴获客(滴滴早期、瑞幸早期)
B. 网络效应(微信、淘宝)
C. 技术领先(但无专利保护)
D. 品牌溢价(苹果、爱马仕)
分析:
A. 纯补贴:不是ESS
- 依赖外部资金输入
- 资金断裂,策略崩溃
- 竞争对手也补贴,军备竞赛
- 不可持续
B. 网络效应:是ESS
- 自我强化(用户越多,价值越大,更多用户)
- 不依赖外部输入
- 竞争对手难以入侵(冷启动困难)
C. 技术领先(无专利):不是ESS
- 技术可以被模仿(6-12个月)
- 领先优势消失
- 除非:技术迭代速度快,保持领先(变成动态ESS)
D. 品牌溢价:是ESS(长期积累型)
- 品牌是长期投入积累
- 竞争对手短期模仿不了
- 用户心智锁定
- 但:需要持续维护
启示:
- 真正的ESS不依赖外部持续输入
- 而是自我强化,或者高壁垒
六、总结
进化稳定策略(ESS)告诉我们:
核心原理:
- 稳定>最优: 不是最好的策略,而是最稳定的策略能长期存在
- 抗入侵性: ESS能抵抗突变策略的入侵
- 环境依赖: 稳定策略随环境变化而变化
- 多样性: 可能存在多个ESS共存(占据不同生态位)
商业应用:
- 识别ESS: 观察行业主流策略,理解为什么稳定
- 设计ESS: 建立难以入侵的策略(壁垒、生态位、动态适应)
- 测试ESS: 抗入侵测试、环境变化测试
- 动态调整: 环境变化时,调整策略,保持稳定
关键策略类型:
- 壁垒型: 高门槛(资本、技术、网络效应)
- 生态位型: 占据独特位置,避免正面竞争
- 动态型: 快速适应能力成为稳定优势
- 条件型: 根据环境/对手调整(如:以牙还牙)
常见陷阱:
- 追求最优而非稳定(过度优化,缺乏韧性)
- 忽视环境变化(策略锁定,难以调整)
- 参与不必要的军备竞赛(红皇后效应)
关键洞察:
长期存在≠最强,而是最稳定、最难被取代。
在商业竞争中:
- 不是做到最好(容易被模仿)
- 而是建立稳定优势(难以入侵)
- 在变化中保持适应(动态ESS)
理解ESS,就能理解:
- 为什么某些商业模式长盛不衰
- 为什么某些创新难以颠覆现有玩家
- 什么样的策略能够长期生存
明天,我们将完成进化思维周,总结整合本周内容。
今日思考:你的产品/策略,是进化稳定的吗?如果竞争对手模仿,你还有优势吗?如果环境变化,你还稳定吗?