进化稳定策略:什么能长期存在?

引子:为什么善良的人没有被淘汰? 从进化论的角度看,一个困惑的问题: 如果"自私"更有利于生存(抢夺资源、不分享),为什么人类社会中仍然有大量"利他"行为? 捐款给陌生人 志愿者无偿服务 见义勇为救助他人 分享知识不求回报 按照"适者生存"的逻辑: 自私者:保留所有资源给自己 → 生存率高 → 后代多 利他者:分享资源给他人 → 自己资源少 → 生存率低 → 后代少 长期来看,利他基因应该被淘汰,自私基因应该统治世界。 但现实不是这样! 答案在于:进化稳定策略(Evolutionarily Stable Strategy, ESS) 核心洞察: 不是"最强者"生存,而是"最稳定的策略组合"生存 在一个群体中,如果某种策略无法被其他策略入侵,它就是进化稳定的 纯粹的自私不稳定(会被背叛),纯粹的利他也不稳定(会被利用) 稳定的是:有条件的互惠(Tit-for-Tat) “以牙还牙"策略(Tit-for-Tat): 第一次合作(释放善意) 之后:对方合作,你就合作;对方背叛,你就背叛 但允许宽恕:偶尔原谅对方的背叛,给第二次机会 这个策略在Robert Axelrod的"重复囚徒困境"计算机竞赛中,击败了所有更复杂的策略,成为冠军! 为什么稳定? 善良:吸引合作者 报复:惩罚背叛者 宽恕:避免陷入永久报复循环 简单:容易被理解和模仿 现实映射: 人类社会:合作是主流,但惩罚机制也存在(法律、道德谴责) 商业:长期合作伙伴关系,而非一次性欺诈 国际关系:互惠原则,而非永久敌对或永久妥协 今天,我们探讨进化稳定策略——什么样的策略能够长期存在,抵御入侵,成为主流? 一、什么是进化稳定策略? 1.1 ESS的定义 进化稳定策略(ESS): 在一个群体中,如果几乎所有成员都采用某种策略S,那么没有其他突变策略能够入侵这个群体(即:突变策略的表现不如S),则S是进化稳定策略。 简单说: 一种策略,一旦成为主流,就很难被其他策略取代 不一定是最优策略,但一定是稳定策略 类似于博弈论中的"纳什均衡”,但强调长期进化动态 数学定义(简化): 策略S是ESS,如果满足: 稳定条件1: S vs S的收益 ≥ 任何突变策略M vs S的收益 稳定条件2: 如果相等,则S vs M的收益 > M vs M的收益 含义: ...

March 12, 2020 at 9:00 AM