注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

jhangping博客

参悟灵魂深处的自己。

 
 
 

日志

 
 

合作的进化  

2011-10-03 16:33:07|  分类: 亲子交流 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

孩子,也许你会觉得上篇有些抽象、杂乱甚至令人费解,而且最后一句话实际上还给你留下了一个疑问,今天我将试着解开这个疑问。

研究合作的一个关键问题是:在一个没有核心权威的利己主义者的世界上什么条件能促使合作出现?在彻头彻尾自私自利的生物群落中能否发展出一种合作战略?

为了研究这个问题,罗伯特·阿克塞洛德(Robert Axelrod)组织了两次电脑比赛,得到了令人惊讶的结果。

电脑比赛的方式是征集一些编成电脑程序的战略,每一特定的战略都按一定的规则以自己的合作策略或欺骗策略对付博弈对手的合作策略或欺骗策略。例如,全骗战略是每一回合的博弈都进行欺骗;随机战略是以随机方法决定在一次博弈中是进行合作还是进行欺骗,等等。在比赛时让这些战略进行“随机赛”,然后比较每个战略得分的多少以衡量其优劣。

第一次比赛时共有15个程序参加比赛。这15个程序中有简单的,也有复杂的。令人惊讶的是,所有程序中最短的一个程序(只有4行)取得了胜利。这个程序是一位心理学家兼哲学家安纳托尔·拉波波特(Anatol Rapoport)设计的,它被称为“针锋相对”(Tit for Tat)。这个程序的战略原则是:第一回合进行合作,以后不管对方是合作还是欺骗,均采取对方上一个回合中的策略。

在总结了第一次比赛的经验教训后,阿克塞洛德组织了更大规模的第二次比赛。他不仅邀请了第一次的所有参加者,而且广为宣传争取更多的人参加。他还给每位参赛者寄去了一份关于第一次比赛的分析。他特别着重分析了善良(不首先进行欺骗,但允许以欺骗报复欺骗)和宽恕(报复之后不再怀恨在心)这两个战略性概念。“针锋相对”就兼具这两种特性,第二次比赛有6个国家、11个专业的62位参赛者。这次参赛的程序总的来看要比第一次复杂得多,最复杂的一个程序是用FORTRAN语言写的,共152行。拉波波特再次用“针锋相对”参加比赛,这个程序在第二次比赛的所有程序中仍然是最短的。

结果真是让人目瞪口呆——“针锋相对”再次取得了胜利。

第二次比赛的参赛者中,有的人不愿意相信善良战略,他们认为可以用比较巧妙的花招和诡计战胜对手。而第二次比赛的结果却再次证明了善良战略的成功:在前15名中只有第8名(哈灵顿程序)不是善良程序,而最后15名中只有1名是善良程序。第二次比赛结果提示出的第三个重要战略概念是可激怒性,即应该很快地被欺骗者激怒并立即进行报复。

第二次比赛后,阿克塞洛德又进行了一些重赛,其中模拟生态适应性的“生态比赛”尤为重要。在这种比赛中,失败的程序最终将遭到生态灭绝的厄运。饶有趣味的是,前述的第8名不善良程序在前200 代生态比赛中成绩颇佳(正如我们从现实社会中所看到的,欺骗始终有一定的市场),随后由于比较弱的程序逐步灭绝,整个生态环境中优良程序比例增大,这个不善良程序在大约1000代比赛时同那些被它欺骗过的程序一样也遭到了灭绝的命运。而“针锋相对”在生态比赛中愈来愈遥遥领先,它起初在群体中仅占1/63,经过1000代的进化,结构稳定下来时,它占了24%。因此,以合作系数来测量,群体是越来越合作的。

合作的进化实验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。“针锋相对”在二人博弈时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的,因为它让对方得到了高分(利他)。哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的“成功者”最终也要被淘汰。

阿克塞洛德还发现,在一个由极端自私者所组成的不合作者的群体中,只要群体的5%或更多成员是“针锋相对”的,这些合作者就能生存,而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后扩展到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的车轮是不可逆转的,群体的合作性越来越大。这一结果,对于曾经在淘宝上购物的人来说其实很好理解。因为每次交易之后,买卖双方都可以相互评价,采取诚信合作策略的人积分会增加,采取欺骗策略的人积分会降低,而这些积分将成为其他人与之交易的指引。因此,经过不同对象间的反复交易,其结果必然是合作的人生意越来越多,欺骗的人生意越来越少。

这组实验非常发人深省,它告诉我们,不论是从战略上还是从战术上看,合作策略都是最优的,“针锋相对”就是一种很好的范例,其战略宗旨是与人为善。即首先采取合作策略,如果得到善良的合作回应就继续坚持;如果得到不善良的欺骗回应则立即以欺骗进行报复。不过报复的目的仅仅是为了将对方导入善良的轨道,因而当对方改邪归正后即迅速给予宽恕。这种策略与我国传统价值观中的“以德报德,以直报怨”如出一辙。

不过,孩子,现实生活中,人并不像电脑那么理性,那么从善如流,有欺骗倾向的人往往并不那么容易改变。如果那么迅速地宽恕他,日后很可能会继续被他欺骗。当然,像博弈论中纳什回复策略那样对任何不合作行为都报以永久性报复也有些过分。因此,我通常采取的办法正如在《话说信任》中提到的,一次欺骗即永不信任,以后尽量避免与他打交道。如果无法避免(实际上常常如此),就采取更加审慎的、有戒备的合作策略,使自己不再那么容易上当受骗。而对于采取报复行为则慎之又慎,即使报复一般也采取较为缓和的方式,除非对方欺人太甚或者突破了我忍耐的底线。这与“针锋相对”策略有些出入,但这是小时候奶奶教给我的方法,对于一些不太好的人,她总是教我重在防范,然后“让别人去收拾他”。我知道这种策略并非最优,但我相信它是奶奶传授给我的人生经验。

再回到上次的话题。这个世界上存在两种人,跟我们有关系的和没有关系的。跟我们没有关系的人完全可以认为我们并不存在。跟我们有关系的人,一般是与我们有血缘或有合作的人。血缘关系的实际意义也在于生活中的互动合作,毕竟两个有血缘关系的人如果从出生就永不谋面也就等于没有关系。因此,也许我们可以这么理解,对于他人来说,我们存在的一切意义都在于跟他们的互动合作。跟我们有关系的人,则可以大致将我们与他的关系分为有益关系、有害关系和中立关系。中立关系处于一个可以向有益或有害方向转化的灰色地带,就其实际意义而言更接近于没有关系,对人们影响最大也往往记忆最深刻的只有有益关系和有害关系。有益关系源于互利或利他博弈,有害关系源于利己博弈。有益关系是尊重、欣赏、友谊的源头,有害关系是厌恶、憎恨、攻击的源头。

孩子,既然如此,就让我们做那5%合作的种子吧。


2011年10月3日16:30,昌都

  评论这张
 
阅读(291)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017