《博弈论》
生活中处处都有竞争,而博弈论就是专门处理竞争问题的方法论。中国古代有关博弈最出名的例子就是田忌赛马了,说双方都有上中下三匹马,而田忌的马比对方同档次的马都慢,但快于下一档,即上等马不如对方的上等马,中等马不如对方的中等马,下等马不如对方的下等马。现在各自出马顺序自己定,通过简单的排列组合我们知道,一共有六种情况,第一种是上对上、中对中、下对下,第二种是上对上、中对下、下对中,第三种是上对中、中对下、下对上,以此类推,田忌想要获胜,有且只有唯一一种情况,就是上对中、中对下、下对上。以三比二的优势可以取胜。这看似只是一个排列组合的脑筋急转弯,但其实包含着丰富的博弈论思想。总结下来,博弈论就是双方或多方在竞争、冲突等情况下,充分了解各方信息,并选择一种为本方争取最大利益的最有策略。简化一下就是,多方竞争中获取对自己最有利的方法。并广泛应用于经济、商业、法律,乃至生活的方方面面。
不过虽然作为一场争取利益的竞争,博弈始终伴随人类发展的始终。但博弈论作为一门被人接受的学科理论,却是近现代才提出。最早由美籍匈牙利数学家冯-诺依曼提出,他同样也是现代计算机理论的提出者和发明者。经过了几个世代的发展与完善,博弈论已经作为一套完备的科学理论,广泛应用于经济学、管理学、商业谈判甚至日常交际之中,更是被称为经济学的第三次革命。是一门大到人类发展,小到生活琐事,无论你是否知晓,但一直都潜藏其中的方法规律。
博弈俗称竞争,那么究竟什么样的事情才能称之为博弈呢。我们先举一个生活中的小例子,周末晚上夫妻双方都在家,丈夫守着电视正准备马上直播的世界杯足球赛,而妻子想要看电视剧的大结局,这时一场有关电视剧选台的博弈就开始了。
那么这里就引出博弈的第一个要素,至少有两个参与者,如果夫妻双方只有一人在家,那这个命题显然不成立,他可以按照自己的喜好选台。只有夫妻双方意见不统一,这才构成了一个双方博弈的情景。而如果夫妻还有一个想看动画片的孩子,那就构成了多方博弈。
第二个要素就是利益,即双方的利益必须不同。上面的例子里,丈夫想看球赛,妻子想看电视剧,这便是利益的冲突。再比如买东西时,同一件商品,商家想要尽量多的赚钱,顾客想要尽量多的省钱,这之中就是价格的博弈。
第三点是策略,即达到自己目的的方法。站在不同的参与者立场上,就会有不同的方法。还是上面的例子就有很多中解决方法,比如丈夫选择明天看重播而把电视让给妻子,比如妻子选择绒平板或者手机看电视剧而把电视机让给丈夫,再比如丈夫陪妻子一起看电视剧或者妻子陪丈夫一起看球赛,甚至于双方大吵一架双方都不看。
就像上面说的那样,虽然策略可能有许多,但怎么才能获得最优策略呢?只有一个电视而双方都想看电视不同台的时候,怎么才能使双方尽量避免冲突呢。第四个要素便是信息,比如说丈夫恰巧知道妻子最近很喜欢一个包包,他就可以用这个包包来讨好妻子获取看电视的机会,这样并不会伤害妻子的感情;再比如妻子知道丈夫有个紧急的工作没有完成而丈夫忘记了,她可以提醒丈夫而独占电视了。古人就曾说过“知己知彼,百战不殆”,信息是制定策略的基础。谁能掌握更多的信息,谁就能制定出更对自己有利的策略以获得自己的利益。
以上便是博弈的四点要素:至少两个参与者、不同的利益、取得利益的策略、制定策略的信息。顺便说一句,很多事件并不是一场简单的博弈,而是多场博弈交织在一起,可能会有多方参与、多个利益点、甚至于信息也有真假之分,说回上面的例子,就比如夫妻双方想看不同的节目,这是一个利益点,但显然双方并不想为了这个破坏感情,那么另一个利益点就是尽量不伤害对方感情。再比如丈夫想用包包讨好妻子,但可能妻子根本不喜欢这款包包,这只是丈夫得的错误的消息。处理这种错综复杂的情况的学问就是博弈论。
上面我们说到了博弈的四个要素,知道了只有满足这四个要素才能称之为一场博弈。另外,博弈还有一个前提和三种结果。博弈的前提就是假设每个参与者都是理性的,且是利己的。不然一方站在另一方的角度,利益一致,自然没有了博弈的关系。而三个结果,分别是负和、零和与正和。
虽然说起来有点绕口,通俗的解释,负和便是双方付出之后没有人获得利益,即双输的局面;零和则是一方胜一方败;正和就是双赢,双方收获大于双方付出总和。接着举上面夫妻争电视的例子,双方僵持不下最后甚至大打出手,没有人能够看成,这就是一个负和结局;一方做出让步,另一方看到自己想看的节目则为零和;邻居家正好在看球,丈夫去邻居家一起看,则夫妻双方各看各的则为双赢。有的博弈根据不同的策略会产生三种情况中的任意一种,而有的博弈并不会有很多结局。比如两国有纷争需要协商,如果求同存异达成一致,最后可能就会共赢,而如果谈判破裂甚至发生战争,则就是一个负和结局,双方都有巨大的损失。而零和博弈,更是广泛存在与经济学生活中,赌博,甚至于股市就是很典型的零和博弈。因为财富并不会凭空出现,总是一部分赚钱,一部分亏钱,赢家从输家手中获得利益。
博弈论中有一个非常著名的命题就是囚徒困境,那么到底什么是囚徒困境呢?说是一户人家发生了入室盗窃和行凶,警察抓住了两个罪犯,分开进行审问。现在两个罪犯只有两个选择,要么不承认行凶,要么承认行凶。如果双方都承认的话双方分别判处8年刑期,如果双方都不承认的话由于没有证据,只能判处入室行窃的罪行,为双方各1年,最后如果一个承认而另一个不承认,则承认的一方会因为坦白从宽而无罪释放,不承认的一方需要判处10年。
就是这么一个简单的问题,站在上帝的视角,我们当然一眼就能知道最有策略是双方都不承认,这样只会判处1年。但这其中有一个最大的问题就是双方无法串供,信息不互通。如果自己不承认而对方承认的话,自己会判10年,而对方会无罪释放。所以不承认的情况下自己有可能判1年也有可能判10年,而承认的话,要么判8年,要么无罪释放。这么想来,对每个罪犯来说,当然选择承认才是自己的最有策略。而这样的结果就是,双方都承认,而最终两个罪犯都被判处8年,反而形成了最坏的结果。
这种双方追求自己利益最大化反而造成最坏结果的博弈最终由诺贝尔经济学奖获得者纳什通过博弈论解释,这就是著名的纳什均衡。说到纳什,他是一个传奇的人物,他即是诺贝尔奖的获得者,也是公认最著名的疯子之一。电影《美丽心灵》就是以他为原型拍摄的。纳什小时候是公认的数学天才,初中时老师用一黑板证明的数学题,他往往几步就能看出结果,弄的老师常常十分尴尬。后来,更是各种超前学习,22岁博士毕业,并在博士论文中提出了“纳什均衡”的理论,这份仅仅27页纸的论文成为了日后博弈论研究中的重要基础。更是在不到30岁便获得了麻省理工学院的终身职位。
然后命运似乎这时开始了转向,之后纳什便换上了很严重的精神分裂症,总是幻想听到看到各种奇怪的事情,要么来自宇宙的神秘信号、要么是敌对国家的神秘间谍、甚至于外星人的神秘通讯。这种状态不仅深深的影响了他的工作与生活,甚至于包括诺贝尔奖在内的许多大奖都与他失之交臂,毕竟他当时甚至于无法在颁奖典礼上说出一句清晰完整的句子。
不过命运对于这个天才始终还是有所眷顾,虽然在纳什生病几年之后,他的妻子艾里西亚由于害怕纳什伤害自己还他们的孩子选择了离婚,但她并没有放弃纳什。在确保了孩子的安全之后,艾里西亚依旧精心照顾了纳什30年,这其间,他们辗转了几家精神病院,甚至连家都搬到了原理喧嚣的普林斯顿,这里安静而又广纳天才,她相信在这里纳什不会被别人当成疯子,只是一个古怪的天才。
经过了长达30年的治疗,纳什的病情终于有所缓和并逐渐康复。并于1994年获得了诺贝尔经济学奖。而艾里西亚也与纳什雨2001年复婚,可以说是纳什成就了博弈论今天的成就,而恰恰是一个平凡的女人艾里西亚成就了纳什。
上面了现代博弈论的基础“纳什均衡”。那么,究竟什么是“纳什均衡”呢?让我们回到之前的囚徒困境中。两个囚犯双方都承认分别判8年是一个纳什均衡,并且是一个坏均衡;而两个囚犯都不承认分别判1年则是一个好均衡。而坏均衡到好均衡之后的转化在于合作,放在本例之中就是互通信息串供。下面整理一下概念,在博弈之中,如果双方都为了自己利益最大化,最终得到的结果就是纳什均衡。这几乎推翻了亚当斯密在《国富论》中提出的,亚当斯密说如果所有人都是自私自利的,为了自己的最大利益行动,则社会就会最大程度的发展。这几乎是西方资本主义经济学的奠基思想。但纳什均衡否定了这种逻辑,所以也就引领了经济学的一次大飞跃。
说到这里,我们不妨也说明一下亚当斯密的观点,他认为如果社会中的所有人都为了自己的利益最大化行动,即资本家为了多赚钱扩大再生产,工人为了自己的利益工作赚钱,商人为了自己的利益多卖商品。这样社会总体一定是被推动向前发展进步的。那么,为什么又会出现博弈论呢?西方经济学之父为什么又会出错呢?
倒也不是亚当斯密说的不对,而是时代变化太快了。在亚当斯密的年代,资本主义刚刚开始萌芽,大家进行的大多是工厂加工出售、农场种植出售这种互不相关的的商业行为,在这种基础上,追求嘴大利益的个人的确会最大程度的刺激社会的发展。而随着资本主义的发展,社会的变迁,商业活动变得越来越紧密,互相之前的关联也越来越大,各种利益关系也变得错综复杂起来。以往单一的经济学模式慢慢就无法解释复杂的经济现象,这也使得博弈论开始追歼走上历史的舞台,并开始发挥出越来越重要的作用。
上面也说了,由坏均衡转化为好的均衡,最重要的就是信息互通,就是合作。照这个逻辑推演下来,解开囚徒博弈,乃至化解博弈的最好方法也就是合作。就拿囚徒困境来说,如果两个囚犯之前有所串供,规避了各自为战的风险,那么两人一定会统一意见,最后都获得最小的刑罚。再举一些生活中的例子,比如两个商家打折促销,如果一方打折,则单品利润会减少,当时销量会增加,而另一方销量会减少,如果另一方不跟着打折,可能销量会持续下降导致经营困难。而双方如果互相比拼打折,最后会造成价格战,导致双方利润都降低,走向一个坏的纳什均衡。那么如果才能解决呢,如果再没有第三方再加入的情况下,对商家来说最好的方法就是双方达成一个同盟,都不降价,甚至于双方都涨价,需求还是这么多,利润自然提高了。当然,这种情况就必须有第三方调整,否则,就会涉嫌行业垄断,损害消费者的利益了。
下面书中说了一些非常有典型性的博弈论命题,这些命题虽然简单,但大多数在现实生活中也都有对应的复杂反应。
智猪博弈——弱小者坐享其成。说的是有两只聪明的猪,一大一小,在一个大大的猪圈里共同生活。猪圈的一头是食槽,而另一边有一个按钮,只有触碰按钮食槽里才会掉下来食物,而食物分量有限。如果小猪触碰按钮,等它跑回食槽,则食物已经被大猪吃完了;而大猪触碰按钮跑回食槽,小猪只能吃掉食物的一半,大猪还有另外一半可以吃。在这样一个模型中,结果已经很明确了。小猪肯定选择等在食槽边不动,因为就算自己按动按钮,也确定没有食物,而大猪只能辛苦的来回奔波,虽然每次都只有一半吃不饱,但也好过饿肚子。放在现代社会,这就像极了那些蹭热度的自媒体,或者跟随大公司花大力气大市场之后借势宣传的小公司。一是他们没有能力制造流量或者开拓市场,或是成本太高,即使投入之后反而会被大公司抢占,不如坐等别人开拓,然后借势进入。当然,这其中也有其他的风险,毕竟现实并不是完美的数学模型。比如改变食槽与按钮之间的距离,或者增减食物的份量。先说距离,如果距离缩短,大猪在小猪刚开始吃的时候迅速跑回来就会出现抢食,而小猪一般是抢不过大猪的;如果距离增加,可能小猪也会把食物吃完,则大猪也就没有动力再去按按钮了。换到现实,即使小公司先人一步,但大公司依靠强大的实力也是可以夺取大部分市场,亦或是大公司在实践后发现这个市场太小甚至于根本不是一个好生意,主动放弃,小公司虽然暂时取胜,但确抢到了一个正在衰落的生意。那么如果改变食物份量呢,一次按动按钮的食物甚至连小猪都不够吃,那这个说明市场基本没有生意,小公司自己尚且不能存活,肯定是方向错误了;而如果增加份量,大公司倒是可能并不介意小公司分一杯羹,毕竟市场很大,自己尚且赚不完,也就不在乎别人赚走其他的了。还有一个钟特殊的情况,就是大猪利用自己的体重优势,率先耗着,饿死小猪,那往后的食物就都是自己的了。这倒像是现在互联网公司的一贯打法了,先烧钱垄断市场,然后肆意妄为。
抢手博弈——最弱的反而活的最久。说是有三个抢手决斗,分别是A、B、C好了。A枪法最好,80%概率击中目标毙命,B枪法次之,60%击中目标毙命,C枪法最差,只有40%概率能打中。那么在这场决斗中谁能幸存,我们先把把问题简单化,假定三个人同时开枪,并假定一轮只能打一颗子弹。那么问题就转化成了瞄准谁并有多少概率打中的问题。对A来说,首要瞄准的就是枪法仅次于自己的B,干掉B,自己与C之间对战赢得概率非常大。B同样也这么想,也会瞄准A,C其实就无所谓了,先假定他也瞄准A。这么下来A被命中的概率就是0.6+0.40.4=0.76,B被命中的概率为0.8,C因为没人瞄准则为0;如果C瞄准B,则A被命中概率为0.6,B被命中概率为0.8+0.20.4=0.88,C还是0。这其实就很有现实意义,一些小国在大国的博弈之中,反而成为了无人针对的对象,从而获得一段时间的发展。在商业之中同样是,如果实力尚弱,则尽量不要让强者把目标放在自己身上,从而获得一轮的发展时间。
斗鸡博弈——坚持就是胜利。一场斗鸡比赛,假设两只鸡分别为A、B,如果A主动退出,则B获胜,A会很没有面子;B主动退出同理,B会很没有面子;如果双方都不退出,则会开始比赛,无论输赢,双方都是两败俱伤;而如果双方同时退出,则双方平局,没有损失。在这场博弈中,鸡会如何做出选择呢?应该是主动退出,还是死磕到底呢。还有一种人类社会中的胆小鬼博弈有着异曲同工,两名车手比试胆量,规则是双方同时加速冲向一个单车道路口,谁如果先减速就会被视为胆小鬼。但如果双方死磕,都不减速,结果必然是双方都车毁人亡。但是每个人又都不希望自己被称为胆小鬼,这时候如果你是车手,会做出怎么样的选择呢?很多人肯定会说,相比死亡,我宁愿被当做胆小鬼,毕竟就算得到再高的荣誉,人死了,就什么都没有了。命题放在生死这种大事上,大家往往能有理性的答案,但生活中的小事往往也有很多人做出非理性的选择。就比如开车时的互相恶意别车,人们很多时候都说不为别的,就为了出一口恶气,不吃馒头争口气等等,最后两败俱伤。在我们仔细分析利弊之后,唯一正确的做法便是在比赛开始之初就拿出你最大的勇气与气魄,吓退对手,而如果对手没有被吓退,已经有了鱼死网破的打算,我们只能宣布认输,这样才是损失最小的做法。
还有一种斗鸡博弈的变种,下面会通过一场有意思的拍卖会来说明,这个拍卖会的规则不同以往,虽然商品依旧价高者得,但之前出价过的人也需要付出金钱,虽然他们得不到任何商品。在这个规则之下,会出现很有意思的现象。商品叫价与商品价值就完全没有了关系,而是取决的对方的叫价。一旦对方叫价超过自己,我们就会吃下全部的损失而没有任何回报,这就像极了商业中的价格战,对方降价,自己可能就没有了销量,但生产的成本已经回不来了。一旦陷入了这种博弈,我们能做的似乎就只有跟随了。当然,除非有把握耗死对手,之后垄断市场补偿损失,否则肯定就是两败俱伤了。这也是现在互联网巨头们常用的招数了。
协和博弈——前期投入还要不要。欧洲曾经花费大量金钱研制协和客机,众所周知,这其实最后是一个失败的项目。在项目进行之中其实也有人提出这样的疑问。但放弃的话前期巨大的投入就会化为泡影,可能还会承受巨大的舆论压力,以至于没有人敢轻易放弃。最后越投入越多,但最终还是没有取得想要的成功。抽象出来的问题就是,如果前期已经有了投入,但希望渺茫,我们要不要继续?这其实是一个非常纠结的问题。一是人们内心不愿意承认自己的失败,更重要的是成功的概率其实没不能明确计算。比如创业之初,大多数创业者都会面临巨大的挑战,要继续吗?继续可能就要承担更大的损失,甚至负债累累,但也可能有一线希望,毕竟辉煌的企业也都是这么熬过来的,而放弃前期的投入就会打水漂。还有我们生活中的例子,家长可能给孩子报名兴趣班培训班,培养爱好,提高成绩,孩子当然很抗拒。这时要不要继续?说不定多学一会孩子就会感兴趣了,前面的钱也不白花,但也可能让孩子更加逆反,人财两空。这种博弈其实并没有太好的双赢策略,理论上的解法是尽量评估成功的可能性,做把握大的事情。但更多的时候我们却是不服输的,不想承认之前的失败,更想要笃定那个小概率的成功。
另外一个重要的事实就是,任何事情都是有成本的。选择继续追加创业的同时,可能会措施其他的机会;选择逼迫孩子继续上课的同时,可能压抑了孩子的创造力。我们在追求那个小概率成功的同时,可能亦会错过其他的机会。这不仅仅是付出金钱、时间的成本,还有损失其他机会的机会成本。金融家们更加熟悉这一套,把钱投资在一个资产里面,如果涨幅没有达到预期,即使账面上没有亏损,在金融家心中它就已经亏损了,因为如果投资其他资产,这笔钱本可以赚到更多。
放在协和博弈中,我们不仅需要考虑当前成功的可能性,还需要考虑如果放弃这件事,把这些资源投入其他更优结果的可能性,这样才能更加全面的做出应对策略。
海盗分金博弈——到底谁最危险?这是一个烧脑的命题。有五个海盗共同瓜分100枚金币,海盗们很讲原则依次抽签决定顺序,抽到1号的海盗可以先提出分配方案,如果大于等于一半人同意,那就按照这个方案分配,如果小于一半人同意,则这个海盗会被扔进大海喂鱼。我们假设每个海盗都绝对服从规则,不会有人鱼死网破之类的举动,并且每个人都是利己的,想要尽可能地获得最大的利益。那么,到底怎么分配呢?乍一看,大家似乎都觉得1号海盗风险最高,感觉不管他怎么划分,即使是自己一个金币都不要,全部都分给其余四人,似乎后面的人也不会放过他,毕竟只要其他人都选择反对,1号海盗必死无疑,这样后面的人才能有决定权,最后一个海盗只要坐等就行了。但真的是这样吗?下面先说结论,其实1号海盗并不需要获得所有人都的同意,由于大于等于一半的规定,其实1号海盗只要再争取到其他两个人同意就可以锁定胜局,而且她也并不需要付出很多,只需要给另外两人没人一枚金币就可以了,他自己可以独吞98枚金币。那么,他究竟是怎么做到的呢?我们可以选择倒推。假设此时只剩4号与5号最后两人,这时4号的分配方案一定是100比0,此时4号当然会同意,而按照规则,就算是5号反对,同意票数也达到了一半。照这个思路往上,还剩3人时,3号分配策略就是99比0比1,他只需要拉拢5号,这种情况下,即使4号反对,5号也只能同意,否则3号失败4号5号两人就会到达刚才的局面,5号反而是是一场空。照这个思路往上推演,1号只需要分配98:0:0:1:1,争取到4号5号的同意,这场博弈就已经结束了。感觉有点儿违反最初的想像,1号看似危险,但其实掌握着整场博弈的主动权,后面的只有被动接受的份。
当然,以上假设都是在理想的情况下设定的,现实中基本不可能有这样的完美博弈,更多作为一种脑筋急转弯似的思维问题。其中有两个最大的问题导致这种逆推法很多时候都无法在现实中得到运用,一是“蜈蚣博弈悖论”,二是理性与非理性的抗争。下面我们分别进行阐释。
蜈蚣博弈悖论说的是什么呢?假设有100枚金币,每一局给两人一枚,给甲金币的时候需要乙同意,给乙的时候需要甲同意,站在宏观的角度我们看到最应该的结果就是双方每一局都同意,最后没人分得50枚金币。这个图形就好似一条左右对称的蜈蚣,名字也是由此而来。但如果使用倒推法,则我们会得到一个完全不一样的最差结局,假如最后一枚金币分给甲,乙来同意,这时乙如果选择不同意,此时甲便会少一枚金币,并且别无他法,而为了避免这种这种情况的出现甲在倒数第二回率先出击,喊出反对把主动权拿在自己手中。照这个逻辑推演,第一回合是谁开始,其实最小的风险就是反对,否则,可能出现别人得到一个金币,而自己什么都没有的情况。站在全局,我们当然知道这是一种两败俱伤的最差结局,没有人得到利益,但逆向推演就会把我们带向这个结局。
上面说了逆向推演的一些问题,但这并不是最严重的。最令人难以捉摸的还是人性,是理性与非理性的抗争。诚然,我们有着一套规则,但如果1号海盗真的提出来98:0:0:1:1的方案,极大地可能性其实是其余四个人联合起来把1号海盗扔进大海喂鱼,其余的人重新分配。即规则只有对理性的人生效,但当出现利益严重不对等的情况,人们往往会变得不理性。这也是博弈中最困得部分,我们要计算的不仅仅是规则,还必须考虑进人性,甚至于更加侧重人性,否则就不能称之为一个好的策略。