1对博弈的理解
什么是博弈
通俗地讲,博弈就是指游戏中的一种选择策略的研究。博弈的英文为“game”,我们一般将它翻译成“游戏”。而在英语中,“game”的意义不同于汉语中的游戏,它是人们遵循一定规则的活动,进行活动的人的目的是让自己“赢”。我们在和对手竞赛或游戏的时候怎样使自己赢呢?这不但要考虑自己的策略,还要考虑其他人的选择。生活中博弈的案例很多,只要涉及人群的互动,就有博弈。
比如,一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭,此时你想逃生。你的面前有两扇门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两扇门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤冲不出去而被烧死。相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?
一个人做选择时必须考虑其他人的选择,而其他人做选择时也会考虑此人的选择。此人的结果——博弈论称之为支付,不仅取决于他的行动选择——博弈论称之为策略选择,同时取决于其他人的策略选择。这样,此人和其他人就构成一个博弈。
博弈的特色
博弈的特色是互动性,就是博弈的参与者至少有两个,即使只有一个人,比如我们考虑今天出门是否带雨伞,也要把天气作为另一个博弈参与者。只要明白了博弈的这个特点,任何事情我们都可以看做是博弈。请看下面这个寓言故事:
有一个人死后升了天,在天堂呆了数日,觉得天堂太单调,于是就请求天使让他去地狱看看,天使答应了他。
他到了地狱,看到繁花似锦的宫殿、一群群妖媚的美女以及各种美食。他对魔鬼说:“今天我决定在这里过夜,听说这里很好玩。”魔鬼同意让他留下来过夜,并派了个美女招待他。
第二天,那人回到天堂。跟地狱比起来,天堂的生活仍然很单调。过了不久,他又开始想念地狱的花天酒地,再次请求天使准许他去地狱。一切都如同上一次,他容光焕发地回到天堂。又过了一阵子,他向天使说他要去地狱永久居住,说完不理天使的劝告,坚决地离开了天堂。
他到了地狱,告诉魔鬼他是来定居的,魔鬼把他迎进去,可这次接待他的是一个蓬头散发、满脸皱纹的老太太。“以前接待我的那些美女哪儿去了?”那人不满又好奇地问。
“朋友,老实跟你说,旅游是旅游,移民却不是一回事!”魔鬼告诉他。
这是一个很简单的故事,但它与博弈有什么关系呢?我们先看里面的局中人,在这个生活场景里有天使、魔鬼、当事人。当事人有两种策略选择:一种是继续待下去,另一种是换个环境比如地狱。这两种选择是他与自己生活状态的一种博弈。如果我们把与他博弈的局中人换成天使,那么他在选择两种策略的时候,就要考虑天使的反应。他想选择第二种策略,去地狱,天使就面临着答应与不答应两种策略。若天使答应他怎么办,若天使不答应他怎么办。当然,最后的策略均衡是答应了。他去地狱后,魔鬼与他进行博弈。用诱惑来吸引他和用丑恶来接待他这两种策略选择中,魔鬼为了留住他,先用第一种策略来吸引。如果魔鬼先用第二种策略的话,当事人肯定要走了,绝不会留在地狱的。魔鬼先选择第一种策略,而等当事人决定留在地狱后,再拿出了第二种策略。魔鬼的每一个策略都是揣摩当事人的意思而定的,他和当事人之间有一个互动关系,如果当事人的策略选择是不留下,魔鬼肯定要换另外的策略,他总是按照当事人可能的策略选择来定自己的策略。
博弈的构成
博弈由很多要素构成,每个博弈至少都包含五个基本要素。
1.局中人
局中人又名决策主体、参与者、博弈者。在一场竞赛或博弈中,每一个有决策权的参与者都成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
博弈中的参与者在游戏里扮演不同角色。比如象棋,有这样几种角色:将、相、士、车、马、炮和卒,俨然一支军队。每个角色都是一次棋局博弈的局中人。当然,比起真实的人生,这个模型过于简单了,但一样可以映射出现实的生活。
在整个人生中,博弈无处不在,因为人们时时刻刻都在想着与他人竞争,时时刻刻都把自己摆在一个局中人的角度。从这个意义上讲,人生本身就是一场博弈,而人则永远是博弈中的局中人。
2.策略
博弈中有了局中人,就要开始进行策略的选择了。一局博弈中,每个局中人都有可供选择的、实际可行的、完整的行动方案。这个自始至终筹划全局的行动方案,称为这个局中人的一个策略。
如果在一个博弈中,局中人都只有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。由于每个人都随时面对各种选择,随时扮演着局中人的角色,所以在人生这场大游戏里,策略的选择异常重要。正所谓“一着不慎,全盘皆输”。
3.效用
所谓效用,就是所有参与人真正关心的东西,是参与者的收益或支付,我们一般称之为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全体局中人所取定的一组策略有关。所以,一局博弈结束时,每个局中人的得失是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。每个人都有自己的支付函数,其实每个人都为自己的每一步行动简单地计算过支付函数中效用的得失,也就是干一件事情值还是不值。
4.信息
在博弈中,策略选择是手段,效用是目的,而信息则是根据目的采取某种手段的依据。信息是指局中人在作出决策前,所了解的关于支付函数的所有知识,包括其他局中人的策略选择给自己所带来的收益或损失,以及自己的策略选择给自己带来的收益或损失。在策略选择中,信息自然是最关键的因素,只有掌握了信息,才能准确地判断他人和自己的行动。
5.均衡
均衡是一场博弈最终的结果。均衡是所有局中人选取的最佳策略所组成的策略组合。均衡是平衡的意思。在经济学中,均衡即相关量处于稳定值。在供求关系中,如果某一商品在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。纳什均衡就是一个稳定的博弈结果。
在上述要素中,局中人、策略、效用和信息规定了一局博弈的游戏规则,均衡是博弈的结果,也是游戏结束的最后结局。
2博弈中的策略选择
任何一个决策都是由决策主体作出的,如果从决策主体的人数来分,决策分个人决策和群体决策。个人决策是指某一个决策者根据他自己的目标从他备选的策略中选择最优策略的一个过程;群体决策则是指一个至少由两个人组成的群体,在一定的规则下,根据群体各成员的决策而形成一个总的决策的过程。
对于某个决策者而言,其决策环境有两种:其他决策者和自然。其他决策者构成他的决策环境是指这样的情况:决策者的利益与其他决策者的行为选择有关联,其他决策者的利益与该决策者的利益存在关联。此时,决策者的策略选择要考虑其他决策者的策略选择,其他决策者的决策也要考虑该决策者的策略选择。此时的行为选择构成一个博弈。博弈是行为的互动过程,当不存在这样的互动的时候,决策便是面对自然的决策。
生活是由无数的博弈即互动所组成的。我们并不是单独地生活在自然之中,而是生活在群体或社会之中。我们不仅从社会中获得生活必需品,而且也从社会中获得荣誉感和认同感。同时,我们也为社会或者说为他人作出贡献。我们与人群中的其他人组成一个互动的社会,我们依存于这个社会。
由于我们生活在社会之中,我们的决策环境更多的是他人。所以我们进行决策时要考虑我们的策略对他人的影响(这个影响反过来又影响到我们自己),我们也要考虑他人的策略选择对我们的影响。
我们的行动和他人的行动是交织在一起的,我们时刻与他人处于互动即博弈之中。因此,这里所说的策略选择是针对我们与他人处于一个博弈而言,而不讨论人们面对自然的决策。因此,在作决策时要对我们所处于其中的博弈局势进行理性分析,正确地作出策略选择,以达到我们所要实现的目标。
3什么是博弈思维
博弈思维是指,当与他人处于博弈之中时,为了实现人生各个阶段的目标,我们主动地运用策略的思维。具体地说,由于我们的目标取决于我们自己的策略选择并且取决于他人的策略选择,我们要使用理性分析,分析各种可能的备选策略以及他人备选的策略,分析这些策略组合下的各种可能后果以及实现这些后果的可能性(概率),从而选择使我们收益最大或者说最能够实现我们目标的策略。作出合理的策略选择是博弈思维的结果。
博弈思维体现了人的理性精神,是一种科学思维。博弈思维认为,我们的任何结果均是决策和行动的产物。正所谓“种瓜得瓜,种豆得豆”,这里的“种”指的是行动,“瓜”、“豆”指的是结果。而要得到理想的行动结果,除了依靠我们的理性思维外,别无他法。
我们每个人都是策略的使用者,时刻都面临着不同的行动选择,时刻都在计算着应当采取何种行动。这种选择不仅体现在选择上哪所大学、学哪门专业、从事何种工作等这样的大事上,而且体现在买菜、穿衣服这样的小事上。然而,尽管我们每个人都是策略的使用者,但为什么有的人功成名就,而有的人却一辈子默默无闻?其答案就在于,他是蹩脚的策略使用者还是优秀的策略使用者。优秀的策略使用者会自觉和不自觉地进行博弈思维,把博弈思维贯穿于各种竞争性的活动之中,从而在人生的各个方面取得成功;而蹩脚的策略使用者缺乏博弈思维,他们的策略选择往往是不合理的,这导致了他们在人生中常常失意。当然,我们这里不是在宣扬某种价值观。事实上,成功与否与幸福之间没有必然联系。默默无闻的人可能幸福一辈子,功成名就的人却可能不幸福。我们在此想要表明的是,如果一个人希望成功,那么他就得运用博弈思维,成为优秀的策略家。
4理性!理性!还是理性!