第12章博弈(2)

书签收藏评论目录封面

抽彩悖论又称凯伯格悖论，由H·凯伯格（H.Kyburgm）在他的《合理信念逻辑的概率》一书中所表述的悖论：我合理地相信在一百万张彩票中有一张将中彩。但我并不合理地相信1号票将中彩，也没有理由相信2号票将中彩。这一过程可以继续下去，以至最终也没有理由相信任何单独一张票将中彩。于是悖论出现了，因为我确实相信有一张票将中彩。这一悖论涉及到部分信念和完整信念之间的关系。

该悖论表明基于概率的信念表达方式与信念推理规刚之间的不一致性。抽彩悖论涉及到在命题与证据逻辑关系不确定的条件下信念表达和推理的问题。

什么是动态博弈？

动态博弈是指参与人的行动有先后顺序，而且行动在后者可以观察到行动在先者的选择，并据此作出相应的选择。

动态博弈的困难在于，在前一刻最优的决策在下一刻可能不再为最优，因此在求解上发生很大的困难。

动态博弈行动有先后顺序，不同的参与人在不同时点行动，先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择，因此，为了做最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？如果我是他，我将会如何行动？给定他的应对，什么是我的最优选择？如下棋。

斗鸡博弈，还是懦夫博弈？

斗鸡博弈（Chicken Game）其实是一种误译。Chicken在美国口语中是“懦夫”之意，Chicken Game本应译成懦夫博弈。不过这个错误并不算太严重，非要把chicken game叫作斗鸡博弈，也不是不可以。

两只公鸡狭路相逢，即将展开一场撕杀。结果有四种可能：两只公鸡对峙，谁也不让谁，或者两者相斗。这两种可能性的结局一样——两败俱伤（这是谁也不愿意的）。另两种可能是一退一进。那谁退谁进呢？

在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、背水一战的决心来，以迫使对方退却。但到最后的关键时刻，必有一方要退下来，除非真正抱定鱼死网破的决心。

斗鸡博弈强调的是，如何在博弈中采用妥协的方式取得利益。如果进的一方同意给退的一方以补偿，只要这种补偿与损失相当，就会有愿意退者。如果双方都能换位思考，可以就补偿进行谈判，达成以补偿换退让的协议，问题就解决了。

为何“狭路相逢勇者胜”？

俗话说：“软的怕硬的，硬的怕横的，横的怕愣的，愣的怕不要命的。”这也是我们通常所说的“狭路相逢勇者胜”的哲学，它在人们的日常生活中同样适用。

斗鸡博弈在生活中比比皆是，不胜枚举。一般说来，如果博弈参与者一方是性格鲁莽、不顾后果的人，而另一方相比而言拥有足够的理性，那么，这位“莽夫”极可能是博弈的胜出者。

比如在商业领域，价格战是竞争的常见手段，如果价格战初见端倪时，最简单的办法就是树立鲁莽、粗暴的形象，以实际行动来威胁对手：“我们对任何的降价行动都将奉陪到底，如果你要降价，那么就让大家都没好日子过!”20世纪70年代，美国通用食品公司就曾采取这种手段，赢得了与宝洁公司之间争夺速溶咖啡市场份额的斗争。

当然，“敌进我退、敌退我进”，“打得赢就打、打不赢就跑”……在势不均力不敌的情况下，暂时的退让也是一种策略。归根到底，博弈双方的行为都是取决于对方的行为，“纳什均衡”究竟表现为谁进攻、谁撤退？具体的说，选择进攻还是后退，选择妥协还是强硬，是要根据自己的实力和当时的实际情况来判断的。怎样做对自己有利就怎样去做，这才是原则。

你知道有趣的鳄鱼悖论吗？

这是在古希腊流传的一个有趣故事：

有一天，一条鳄鱼从一位母亲的手中抢走了她的孩子。这位母亲伤心欲绝，苦苦地哀求它。

鳄鱼说：“如果你能猜出我现在的想法，我就把孩子毫发无伤地还给你；如果你猜错了，我就要吃掉你的孩子。”

这位聪明的母亲仔细地想了想，说：“鳄鱼先生，你是想要吃掉我的孩子。”

鳄鱼冷笑着说：“你猜对了，我当然会吃掉你的孩子，哈，哈……”说着，就要吃小孩。

这时母亲急忙说：“你刚才不是说，我答对了，你就把孩子还给我吗？快给我孩子！”

鳄鱼惊呆了，心想：“对呀，如果我吃了小孩，她就答对了。不行，看来这个小孩不能吃。”“那么，我应该怎么办呢？”鳄鱼碰到了难题：它既要吃掉小孩，同时又得把小孩还给他的母亲。不过，鳄鱼又想：“如果我把孩子还给她，那么，她就答错了。所以，我就应该吃掉小孩。”这样一想，鳄鱼坚持不把小孩交给他的母亲。

然而，这位母亲仍然坚持说：“你必须把小孩还给我。因为，如果你吃了我的小孩，我就说对了，你就得把孩子还给我。”

这时鳄鱼便陷入一个悖论当中，无论鳄鱼怎样做，都无法兑现自己的许诺。因为鳄鱼的诺言有两项内容：

A.如果妈妈猜对，我就释放小孩；

B.如果妈妈猜错，我就吃掉小孩。

在妈妈表达了猜测之后，鳄鱼的行为只有两种选择，而这两种选择都与鳄鱼原先的诺言相违背。

鳄鱼的第一种选择，把小孩吃掉。这种选择的结果证明那位妈妈的猜测是正确的，按照鳄鱼原先的许诺（A），此时鳄鱼应该把小孩“毫发无伤”地归还啊！但是鳄鱼却把小孩吃掉了，所以鳄鱼违背了自己的诺言。这就是著名的鳄鱼悖论。

鳄鱼的第二种选择，把小孩放掉。这种选择的结果证明那位妈妈的猜测是错误的，按照鳄鱼原先的许诺（B），此时鳄鱼应该把小孩吃掉啊！但是鳄鱼却把小孩释放了，所以鳄鱼还是违背了自己的诺言。

什么是非零和博弈？

非零和博弈是一种非合作下的博弈，博弈中各方的收益或损失的总和不是零值，它区别于零和博弈。在经济学研究中很有用。

在非零和博弈中，对局各方不再是完全对立的，一个局中人的所得并不一定意味着其他局中人要遭受同样数量的损失。也就是说，博弈参与者之间不存在“你之得即我之失”这样一种简单的关系。其中隐含的一个意思是，参与者这间可能存在某种共同的利益，蕴涵博弈参与才“双赢”或者“多赢”这一博弈论中非常重要的理念。

譬如，在恋爱中一方受伤的时候，对方并不是一定得到满足。也有可能双方一起能得精神的满足。也有可能双方一起受伤。通常，彼此精神的损益不是零和的。

非零和博弈既有可能是正和博弈，也有可能是负和博弈。

正和博弈，指博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害，因而整体的利益有所增加；

负和博弈，即双方都有损失。

究竟该开窗还是关窗呢？

电影《美丽心灵》中有这样一个情节：烈日炎炎的下午，纳什教授正在给学生们上课，这时教室附近有几个工人正施工，机器的响声成了刺耳的噪音，于是纳什走到窗前狠狠地把窗户关上。有同学提出意见：“教授，请别关窗子，实在太热了！”而纳什一脸严肃地回答说：“课堂的安静比你舒不舒服重要得多！”

趁教授转身在黑板上写数学公式之际，一位叫阿丽莎的漂亮女生（她后来成了纳什的妻子）走到窗边打开了窗子，对窗外的工人说：“打扰一下，嗨！我们有点小小的问题，关上窗户，这里会很热；开着，却又太吵。我想能不能请你们先修别的地方，大约45分钟就好了。”干活的工人听了，愉快地答应了。

阿丽莎回过头来快活地看着纳什教授，纳什教授也赞许地看着她。

阿丽莎对“开窗难题”的解答，使得原本的一个零和博弈变成了另外一种结果：同学们既不必忍受室内的高温，教授也可以在安静的环境中讲课，结果不再是0，而成了+2。由此我们可以看到，很多看似无法调和的矛盾，其实并不一定是你死我活的僵局，那些看似零和博弈或者是负和博弈的问题，也会因为参与者的巧妙设计而转为正和博弈。

所有的博弈都有纳什均衡点吗？

不一定存在纯策略纳什均衡点——所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点——所谓混合策略是指参与者采取的不是惟一的策略，而是其策略空间上的概率分布。

如同小孩子之间玩“剪刀石头布”的游戏，在这样一个游戏中，不存在纯策略均衡，对每个小孩来说，自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的，不能让对方知道自己的策略，哪怕是“倾向性”的策略。如果对方知道你出其中一个策略的“可能性”大，那么你在游戏中输的可能性就大。因此，每个小孩的最优混合策略是采取每个策略的可能性是l／3。在这样的博弈中，每个小孩各取三个策略的1／3是纳什均衡。

由此可见：纯策略是参与者一次性选取的，并且坚持他选取的策略；而混合策略是参与者在各种备选策略中采取随机方式选取的。在博弈中，参与者可以改变他的策略，而使得他的策略选取满足一定的概率。当博弈是零和博弈时，即一方所得是另外一方的所失时，此时只有混合策略均衡。对于任何一方来说，此时不可能有纯策略的占优策略。

你能“迫使”对手与你合作吗？

当你处于绝对劣势时，只有借助其他人的帮助才能扭转局面，而其他人又不愿意出手相助，你有办法“迫使”那个人与你站在同一条船上吗？博弈论中，的确有一种给对方设置囚徒困境，从而“逼迫”对手与自己达成合作的方法。

如图书出版行业，发行商往往不能及时给出版商结算书款，即使书卖出去了也不肯结算。只有当出版商在发行商那里有了一定的“账底”之后，发行商才陆续给出版商结算“账底”以外的书款。著名出版家张静庐先生在其著作《在出版界二十年》中，叙述了他在20世纪初做出版时所遭遇的这种困境：如果此时出版商不再与发行商合作，那么以前的账底就成了“千年不还，万年不赖”的长期烂账，出版商永远也别想再要回来。在这里，发行商就成功地给出版商制造了一个迫使其合作的“囚徒困境”。

总而言之，在孤立无援的时候，不要一味悲观失望，而是要想办法把你的对手绑在自己的船上，让对手和你陷入同样的困境。此时，他为了保全自己的利益，就会无奈地做出与你合作的选择。

怎样打破囚徒困境？

囚徒困境是每个人都在根据自己的利益做出决策，但结果是谁也得不到好处。那么，能否打破囚徒困境，使处于囚徒困境中的人彼此协调自己的行动，从而使双方的利益都达到最大化呢？

答案是肯定的，以下就是走出囚徒困境常见的法则：

1、施以报复，让背叛行为不敢发生。

假如每一个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复（比如杀他全家），那么每个囚徒就可能因担心未来的报复而在现在选择拒供，使得“拒供，拒供”成为均衡的结果。合作达成了。

2、契约合作，建立相互信任的关系。

在囚徒困境中，假如每个人都彼此相信对方不会招供，那么合作拒供的结果也可以出现。因此，合作的关键是相互的信任，也就是说，如果能够达成一种信任关系，那么也就可以达成合作。

3、长期关系和重复博弈。

有的博弈是重复的。比如商业合作，往往不仅限于一次。如果你选择了背叛，虽然就这一次博弈考察你占到了便宜，但你失去了以后合作的机会，从长远考察则是吃了亏。因此，一个理性的人为了从合作中持续不断地获得利益（而不是“一锤子买卖”），则必然会选择忠诚而非背叛。也就是说，对于理性经济人而言，他会为了长远的将来利益而牺牲眼前的利益。

你会以牙还牙吗？

根据重复博弈的重复次数，可以将其分为有限次重复博弈和无限次重复博弈。

影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。在重复博弈中，参与人存在着短期利益和长远利益的均衡，有可能为了长远利益牺牲短期利益而选择不同的均衡策略；而信息的完备性之所以影响均衡结果，是因为如果每一个参与人的特征不为其他参与人所知时，该参与人就很有可能积极建立一个好声誉，以换取长远利益。

在有限次重复博弈中，假定重复有限的N次，这意味着所有参与人都能预测到最后一次（第N次）的收益。在第N次博弈中，各参与人都知道对方的“以牙还牙”，但是他也知道如果在这次博弈中自己选择背叛，将使自己受益而其他参与人受损，且也不会留给对方报复的机会（博弈到第N次结束）。所有参与人都明白这一点，因此在最后一次博弈中将都采取背叛，这与一次博弈的上策均衡结果相同。

在现实中，人们往往很难弄清重复博弈的结构。由于难以预期与对手的竞争何时是最后一次，因此，只要竞争时期足够长，竞争的双方都预期未来还要进行很多次博弈，那么，竞争的结构就可能近似于无限次重复博弈，使得双方在竞争中出现相互合作的局面。

为何说日久见人心？

重复博弈可以减少信息的不对称性，从而带来博弈双方间的一种均衡。我国有一句俗语正反应了重复博弈的这种作用——即“日久见人心”，它是指日子长了，就可以看出一个人的为人怎样。其出处为宋朝的陈元靓所写的《事林广记》卷九：“路遥知马力，事久见人心。”为什么日久就会见人心呢？这是因为，日子长了，人们间的博弈的次数多了，掌握着关于对方的为人等方面的越来越多的信息，就会对对方逐渐的了解和熟悉起来。

世事如棋，人心难知，广泛存在的信息不对称使我们时时刻刻需要面对他人欺骗和自身失误的风险。由此，无论是辨材还是识人，都不能根据一时一事的现象下结论，而要从或长或短的时间和历史上来衡量。因此，随着时间的增加，交往的深入，观察的全面，我们会获得事物和人更多的信息，从而改善信息不对称的局面，方便我们得出比较贴近真实的结论。

现代信用是如何产生的？

斯密指出，人是先靠互通有无、互助合作来维系生存的，人类是靠利己心来满足需求的。商品交换是人们互相之间的满足，为了自己的需要而去满足他人的需要。他说，“在所有的国家当中，荷兰这个商业化的国家其守信程度最高。英格兰要比荷兰差一些，但是比苏格兰要好得多——原因可归结为自私——这种自私在英格兰人中和荷兰人中都是一样的。交易者因为害怕失去信誉，因而会很小心的遵守每一项承诺。当一个人一天交易20次的话，他就不大可能欺骗别人，因为那样会使他失去更多。当人们之间的交易很少的时候，我们发现人们就有可能进行欺骗，因为通过欺骗得到的东西比他们由此受到的损害要多。”

第12章 博弈(2)

第12章博弈(2)