书城经济趣味博弈学
3253600000003

第3章 纳什均衡与最优策略

一、美丽心灵:纳什

1994年度的诺贝尔经济学奖获得者纳什的传奇经历耐人寻味。

纳什在1950年7月13日22岁生日那天获得数学哲学博士学位。而40多年以后获得诺贝尔经济学奖的主要缘由,就是他的博士学位论文。

1957年当纳什到普林斯顿高等研究院访问的时候与阿丽莎结婚,一年后纳什在麻省理工学院得到了终身职位,阿丽莎怀上了他们的孩子,也是在这个时候,美国著名的《财富》杂志把纳什评为美国最耀眼的科学新星。生活多么美好,多么甜蜜!却不料在纳什的学术生涯向巅峰攀升的大好年华,病魔袭击了他。

从1959年开始,偏执型精神分裂症使他几乎成为一个废人。上课时候,他会语无伦次,甚至做出很不像样的举动。讲演会上,他会说一些不连贯的、毫无意义的内容,因为实在无法继续工作,纳什辞去了在麻省理工学院的教职。纳什完全被病魔所控制,他热衷于给政治人物写一些奇怪的信,在欧洲悠悠荡荡差点被法国警察抓到精神病院。留在国内的妻子以及他的同事开始收到一些奇怪的明信片,充斥着莫名其妙的数字。他怀疑被跟踪、被刺杀,甚至一度要求放弃美国公民的身份。

最终,纳什夫妇分居了,后来正式离婚。纳什回到西弗吉尼亚州,和母亲住在一起。往后的30多年,纳什的时间是在故乡西维珍尼亚、精神病医院和普林斯顿度过的。

离婚以后,好心的阿丽莎还是让纳什像在普林斯顿的时候和她住在一起。她再也没有结婚,依靠自己作为电脑程序员的微薄收入和亲友的接济,照料前夫和他们的儿子。

阿丽莎坚持认为纳什应该住在普林斯顿:在别的地方如果你行为古怪,会被当做疯子,可是在普林斯顿这个有许多人获得过诺贝尔奖的地方,如果你行为古怪,人们会想你可能是一个天才。这里不仅有树林中的爱因斯坦小道,而且人们都知道爱因斯坦为邻居小女孩做算术题换取糖果的轶事。

普林斯顿的人们充满了爱心,但是却一度越来越相信曾经做出过如此深刻的科学发现的纳什,恐怕再也逃不出常常要被送进精神病院的命运。想不到,医生、亲人和普林斯顿的爱心,终于浇育出绚丽的花朵。我不想说那是奇迹。

大约在20世纪80年代,纳什的病情开始有了转机。他逐渐可以与人交谈,有时候还可以讨论一点儿问题。特别是,他终于跟上在他被精神分裂症折磨的30年里不断更新换代的计算机。

差不多就在这个时候,纳什曾经成为诺贝尔经济学奖候选人,但是最终没有成功。当时间走近1994年的时候,博弈论获奖的形势更加有利,是瓜熟蒂落的时候了。

纳什的故事还被好莱坞搬上了银幕——《美丽心灵》,并且获得许多奖项。感兴趣的读者可以看看这部感动心灵的好莱坞经典电影,通过电影可以对纳什有更感性的了解。

讲纳什的传奇人生经历,主要是为了讲解“纳什均衡”。

纳什均衡的意义在于,它是关于博弈结局的一致性预测,如果所有局中人预测一个特定的纳什均衡会出现,那么这种均衡就会出现,预测之间没有矛盾,不会因为有的局中人认为不符合自己的利益要求而失败。

只有纳什均衡才能使每个局中人均认可这种结局,而且他们均知道其他局中人也认可这种结局。而非纳什均衡的结局并非一致性预测,如果局中人预测会出现非纳什均衡,那么或者是局中人的预测相互不统一,或者是局中人在估计别人的策略选择或极大化自己的支付时犯了错误。

纳什均衡最重要的性质是“自我强制性”。如果局中人就纳什均衡结局达成协议,那么不需要任何外力的帮助,它自身就蕴含着保障实现的力量。

任何非纳什均衡的结局要成为协定都需要外在强制力量(道德、法律等)的帮助,否则有的局中人将会有动机背叛协定。

纳什均衡的弱点在于,它并不能保证唯一性,存在多个纳什均衡时哪一个会在现实中出现是一个难以解决的问题。另外,引入其他理性考虑后,有些纳什均衡并不那么合理。

在纳什均衡定义的基础上,可以进一步定义强纳什均衡,强纳什均衡是指每个局中人对于对手的策略有唯一的最佳反应,即为严格纳什均衡。

原则上,强纳什均衡是一个更具有说服力的均衡概念,它具有稳定性,即使支付中出现微小的扰动,强纳什均衡仍保持不变。

而且,由于局中人改变策略会使其利益受损,所以局中人有维持均衡策略的动力。而纳什均衡中可能有的局中人会认为均衡策略与其他策略之间是无差异的,所以并不能保证局中人一定会选择均衡策略。

纳什均衡的弱点是,即使在混合策略意义下也不能保证存在性,相当多的博弈局势中没有强纳什均衡。

二、情侣博弈

大海和丽娟正在热恋。难得的周末又到了,安排什么节目好呢?

周末晚上,中国足球队要在世界杯外围赛中和伊朗队展开生死之战。大海是个超级球迷,国内的甲级联赛都不肯放过,何况是不争气的国家队的一场生死大战?也正好是这个周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧《胡桃夹子》!

这么说,一个在家里看电视直播的足球,一个去剧院看芭蕾舞演出不就得了?问题在于他们是热恋中的情侣,分开各自度过这难得的周末时光,才是最不乐意的事情。这样一来,他们就面临一场温情笼罩下的博弈:

在情侣博弈中,双方都没有严格优势策略和严格劣势策略。我们不妨这样给大海和丽娟的“满意程度”赋值:

如果大海看球让丽娟一个人去看芭蕾,双方的满意程度都为0;

两人一起看足球,大海的满意程度为2,丽娟的满意程度为1;

两人一起去看芭蕾,大海的满意程度为1,丽娟的满意程度为2.

应该不会有丽娟独自看球而大海独自去看芭蕾的可能,不过人们还是把它写出来,设想因此双方的满意程度都是0.

这样来描述大海和丽娟的情侣博弈,你觉得怎么样?

现在,芭蕾不是大海的劣势策略,因为如果丽娟坚持芭蕾,他选足球只得0,选芭蕾却还可得1.足球当然更不是大海的劣势策略。所以,大海没有全面的劣势策略。同样,丽娟也没有全面的劣势策略。这样,严格劣势策略消去法就没有用武之地了。

但是,他们总会做出一个较好的选择,因为他们是热恋中的情侣。

在情侣博弈中,双方都去看足球或者双方都去看芭蕾,就是我们所说的相对优势策略的组合:一旦处于这样的位置,双方都不想单独改变策略,因为单独改变没有好处。准确地说,是单独改变不会带来额外的好处。

如果两人一起看足球,大海得2丽娟得1;

如果大海单独改变去看芭蕾,变成双方都得0,没有好处;

如果丽娟单独改变去看芭蕾,也变成双方都得0,也没有好处。

所以,两人一起看足球是稳定的结局。同样,两人一起去看芭蕾也是稳定的结局。

什么是纳什均衡呢?简单说就是,在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他单独改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。

需要强调的是:均衡不一定是博弈的最优结果。

在“囚徒困境”中,唯一的均衡是一起招认,站在群体的角度,这是最坏的结果。均衡只是博弈的最“稳定”结果,或者说是最可能出现的结果。

纳什均衡就是指,在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。

三、两只公鸡博弈

在一座独木桥上,北方王红鸡和南方王黑鸡相遇了。

红鸡傲慢地说:“快给我让路,否则我把你撞到河里喂鱼。”

黒鸡也不甘示弱地说:“还是你先给我让路,否则我把你撞到河里喂鱼。”

两只鸡谁也不肯服输,僵立在独木桥上等待对方让路。

几天几夜过去了,两只鸡仍僵立在独木桥上等待对方让路。

故事中每只公鸡有两个行动选择:一是退下来,一是进攻。

如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。

因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退。

两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进的公鸡获得1的支付,赢得了面子,而后退的公鸡获得-1的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获得-1的支付。当然这些数字只是相对的值。

这个博弈有两个纳什均衡:一方前进,另一方后退。

但关键是谁进、谁退?

一个博弈,如果有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一个事先知道的唯一的博弈结果。

但是如果一个博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果来。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。

一个博弈,如果有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一个事先知道的唯一的博弈结果。

四、新闻大战

有两大杂志——《时代》和《新闻周刊》在进行激烈的竞争。每个星期,两大杂志都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们一定会闭门举行会议,选择下一个封面故事标题。

假定本周有两个大新闻:一是国会就预算问题吵得不可开交,二是发布了一种据说对艾滋病有特效的新药。

编辑们选择封面新闻标题的时候,首先考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条封面新闻标题都会买这本杂志)。

在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣,这些人只会在自己感兴趣的新闻变成封面新闻标题的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面标题,那么感兴趣的买主就会平分两组,一组买《时代》,另一组买《新闻周刊》。

现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采用艾滋病新药做封面标题,那么,假如我采用预算问题,我就会得到整个‘预算问题市场’(即全体读者的30%);

“假如我采用艾滋病新药,我们两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),因此,艾滋病新药为我带来的收入就会超过预算问题。

“假如《新闻周刊》采用预算问题,那么,假如我采用同样的故事,我会得到15%的读者;假如我采用艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来更大的收入。

“因此,我有一个优势策略,就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我的其他策略更胜一筹。”

在这个博弈里,双方都有一个优势策略。以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。

虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。

不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。

一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。

假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办。

同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。

在你没有优势策略的情况下,你要做的就是剔除所有劣势策略,不予考虑。如此一步一步做下去。

假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。

假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。

即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈的复杂程度。

利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。

你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也是一样。

假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

五、把功劳让出去

明朝正德年间,朱宸濠起兵反抗朝廷。王阳明率兵征讨,一举擒获朱宸濠,建了大功。

当时受到正德皇帝宠信的江彬十分嫉妒王阳明的功绩,以为他夺走了自己大显身手的机会,于是,散布流言说:“最初王阳明和朱宸濠是同党。后来听说朝廷派兵征讨,才抓住朱宸濠以自我解脱。”江彬想嫁祸并抓住王阳明,作为自己的功劳。

在这种情况下,王阳明和张永商议道:“如果退让一步,把擒拿朱宸濠的功劳让出去,可以避免不必要的麻烦。假如坚持下去,不做妥协,那江彬等人就要狗急跳墙,做出伤天害理的勾当。”

为此,他将朱宸濠交给张永,使之重新报告皇帝:朱宸濠捉住了,是总督军门的功劳。这样,江彬等人便没有话说了。

王阳明称病休养到净慈寺。而张永回到朝廷,大力称颂王阳明的忠诚和让功避祸的高尚事迹。皇帝明白了事情的始末,免除了对王阳明的处罚。

王阳明以退让之术,避免了飞来的横祸。

王阳明让出名誉,保全自己的做法无疑是睿智的。

面对复杂多变的形势,人们不仅需要慷慨陈词,而且需要沉默不语;既需要穷追猛打,也需要以退为进;既应该争,也应该让。一句话,有为是必要的,有时候无为也是必要的。

然而,什么时候有为,什么时候应该无为呢?无为和有为的选择取决于主客敌我双方的力量对比。

当主体力量明显占优势,居高临下,采取行为以后,可以取得显著的效果时,应该有为。

而当主体处在劣势的位置上,稍一动作,就可能被对方“吃掉”,或者陷于更加被动的境地,那么,便应该以退为进,坚守“无为”方是。

无为只是一种权宜之计、人生手段,待时机成熟,成功条件来到,便可由无为转为有为,由守转为攻,这就是中国古人所说的屈伸之术。

当主体力量明显占优势,居高临下,采取行为以后,可以取得显著的效果时,应该有为。

六、价格大战

《时代》和《新闻周刊》两大杂志,每本杂志的制作成本是1美元,且售价只有两个可能的价位选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为l美元)。

假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。

杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800万。

这时,你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润,即如果双方都是3美元,利润都是500万;一方降价至2美元,独得800万,另一方分文不得;如果双方都降,每一方利润都是400万。

《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。

《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。

问题是比较这两个数字毫无意义。

500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如《时代》把价格降到2元,利润还会更高,达到800万美元。

假如你有一个优势策略,请照办。不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。

提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。

若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。

假设你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自己的优势策略。

正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。

但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时做出自己的决定,因此你有机会影响他的行动。

某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。

在竞争对局下,假如你先行采取策略,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时做出自己的决定,因此你有机会影响他的行动。