暂时搞定了home键专利的事情之后,刘猛想着和杜毅的博弈,本来就对博弈很感兴趣,而又一直是具有超强的学习能力,典型的学霸,顿时就想研究一下博弈论,找到了几本电子版的书籍开始看起来。()
除了超强的心态,还要具有知识,知识就是力量这话一点不假,用知识来武装心态,这才是学霸的真本色。
拿起书本来,一页页地翻看了起来,其实博弈论涉及到很多概率论模型的建立和分析知识,而概率论其实可以看做是数论和随机理论之间的综合,而这两个领域恰恰是刘猛最为擅长的,几乎看一页就能明白一页,而且翻阅起来还很快速,很快就把理论搞明白了,看到了一个很有意思的关于囚徒困境的故事。
一个警察与小偷的故事。假设有两个小偷a和b联合犯事、私闯民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年。
如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
对a来说,尽管他不知道b作何选择。但他知道无论b选择什么,他选择“坦白”总是最优的。显然,根据对称性。b也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。
刘猛略一沉思,越觉得博弈论确实有趣,这是对人心的理论剖析,很快又翻到了下一个故事。
两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来。他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格大概在**十元的价位浮动。但是不知道两位旅客买的时候的确切价格是多少。
于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样。航空公司就认定写得低的旅客讲的是真话。并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。
为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。可是不,甲很聪明。他想:如果我少写1元变成99元,而乙会写100元。这样我将得到101元。何乐而不为?所以他准备写99元。可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……
下象棋的时候,不是说要多看几步吗,看得越远,胜算越大。你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都彻底理性,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡,是两人都写0。
刘猛看完摇了摇头,现实生活中就是这样,不患寡而患不均,这是埋藏在每个人心底的劣根性,这就是所谓占小便宜吃大亏了,都想着占便宜,最后会吃大亏。
仅仅几个小时的翻阅,因为对其理论知识有着深刻的理解,刘猛开始尝试分析他和杜毅之间的博弈模型,在心态平和的情况下,到底自己怎样才会占优呢?刘猛不能主动联系杜毅,一旦联系就失去了主动权,但是又想杜毅主动联系自己,获得进一步的消息。
这就好比是斗鸡博弈,试想两人狭路相逢,每个人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没有退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。
在此博弈中,两个参与者是平等的主体。在双方都选择前进策略的情况下,相当于都威胁对方说自己将进入最后通牒博弈的互相威胁状态。这个博弈有两个纯策略纳什均衡:一方前进,另一方后退;或一方后退,另一方前进。