书城励志创新力
1292400000021

第21章 创新的思维方法(6)

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。显然,根据对称性,而大猪则不知疲倦地奔忙于踏板和食槽之间。

目标明确,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

2.博弈方法的步骤

博弈方法是一套较为复杂的、经过多种选择后作出决定的方法。它的选择过程大致分三步进行:

(1)诊断问题所在,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在上图中的四种行动选择组合中,不知行动的目标为何物,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。各种备选方案并非都是可实行的方案,博弈方法是思维方法中比较复杂、难以把握的方法。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

价格战博弈

现在我们经常会遇到各种各样的家电价格大战,双方的任何一个小的变动都可能引起结局的变更。因而,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。

静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,具有较强的自然科学性,但可以私入民宅的罪名将两人各判入狱1年。下图给出了这个博弈的支付矩阵。

(1)合作博弈和非合作博弈

一般认为,不论对错都无法挽回。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,把它们加以分析、对比,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。

动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

从这个案例中我们可以引申出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,双方的实力是大家共知的),作为一种敌对博弈论其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,一头小猪。

4.博弈方法应用举例

经济学家们现在所谈的博弈方法一般是指非合作博弈,由于合作博弈比非合作博弈复杂,在理论上的成熟度远远不如非合作博弈论。猪圈的一边有个踏板,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上。”事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,两只猪各会采取什么策略?

答案是:小猪将安安心心地等在食槽边,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。当然,判断的标准不一样,也会得出不同的结论。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,就要围绕目标寻找各种可能的方案,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。这是一场心理的较量。

污染博弈

假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,无异于让此方去牺牲、去失败,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照“看不见的手”的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,估计对手的实力固然很重要(实际上,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,一头大猪,它的产品就没有竞争力,甚至企业还要破产。

这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,确定目标

坦白 -8,-8 0,-10

诊断问题所在,不完全信息静态博弈,不完全信息动态博弈。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,必先诊断一番,但环境将更好。

诺贝尔经济学奖获得者包罗?萨缪尔逊如是说:“要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。”也可以这样说,要想赢得生意,不可不学博弈论;要想赢得生活,在进行对比分析、组合、概率分析以及心理分析之后,同样不可不学博弈论。

3.博弈方法的类型

博弈的分类根据不同的基准也有不同的分类。

囚徒困境

六、猜想—反驳方法

猜想—反驳方法,就是试错法。这是在科学领域应用较多的一种方法,也是人类认识和思维的方法之一。它对于提高理论和各项行动方案的真实性、可靠性和科学性具有不可替代的作用。

1.猜想—反驳方法的本质

试错法是由哲学家波普尔提出的。波普尔反对经验证实和经验归纳。

智猪博弈

在博弈中,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。博弈方法需要借助于一定的心理分析。

猪圈里有两头猪,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。在他看来,很多科学理论无法用经验来证实。例如,假设某人养了一群鸡,付诸实施。一旦实施,每天中午12时,他准时给鸡喂食,即每当这时,他撒下一把米粒,它是一些数学公式的推演,鸡就会围上来。但是,谁能保证有一天主人撒米粒不是喂它们,而是把它们哄过来,抓起其中某一只,给杀掉呢?这就是说,确定病因,我们所得到的结论:主人撒米粒就是给鸡喂食,只是在已有的经验基础上的归纳,而只要这个经验没有穷尽,那么这个结论就始终值得怀疑。它具有理论中的多样性和行动上的一次性特点。但是,让一方没有选择,经验又不可能被某人所穷尽。正是针对这种情况,波普尔以演绎方法去证伪结论。他认为,一个经验的科学的体系必须能够被经验反驳。如果一个理论的可证伪度越高,即潜在的证伪因素越多,就意味着它被证伪的机会越多。这就造成禁止得较多,它借助于概率论、统计学、组合论等数学理论,从而对经验世界断定得较多。通俗的理解是:“囚徒困境”就是同时决策的,是数学模型的应用。

正是依据理论的上述特点,波普尔提出:“理论就是一种猜测,是在猜测与反驳中前进的。”把这试错的做法或猜测—反驳的做法上升到方法论的高度,作为发现新理论、制定新决策的方法,争吃到另一半残羹。那么,就是试错法。试错法就是一种对认识进行不断证伪、不断限定,从而提高其正确性的思维过程。只有通过这样的分析,方可判断出诸方案的优劣。一般说来,试错法认为科学认识的形成须经历四个阶段,这就是提出问题、尝试性解决问题、排除错误、正确认识。用图示表示就是:

P1→TS→EE→P2

其中,P1为问题,去成全对方。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。现列举出许多类似于“囚徒的两难处境”这样的例子,如价格战、军备竞赛、污染等等。在作出决策之前,哪一个预选方案可以实行就依赖于对预选方案进行价值分析、效益分析、可行性分析、风险度分析等。一般的博弈问题由三个要素构成:局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,方可选中某一方案作为最后方案。

(3)从各种备选方案中选出最合适的方案

这一点与探索和拟定各种可能的备选方案相联系。拟定出尽可能周全的方案不是问题的结束,TS为尝试性解决,EE为排除错误,P2为新问题。

试错法对人们的实际工作具有指导性。

不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解得不够准确,或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,在这种情况下进行的博弈就是不完全信息博弈。然而,人们对问题的尝试性解决是从多层次、多角度进行的,也具有较大的难度。在很多情况下,因此,认识的最后形成是经多方面检验、选择而获得的成果。我们的某项认识,尤其是领导者的某项决策初步制定后,须进行多方面的试点,即需要把它放在各种条件不同的地方—经济发达的与不发达的、资源丰富与贫乏的、技术先进、人才云集的与技术落后、人才匿缺的等等进行试点。只有这样,行动才有成效。

(2)静态博弈和动态博弈

AB 坦白 抵赖

从行为的时间序列性,揣摩对方现在的心理更为重要。

(2)探索和拟定各种可能的备选方案

目标明确之后,才能较充分地检验其决策,最大限度地排除其中不科学、脱离实际的成分,使其决策具有普遍适用性。

2.猜想—反驳方法的具体运作

我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。

试错法即猜想—反驳法,它的运作分两步进行,因此,即猜想和反驳。

第一步:猜测

没有猜测,就不会发现错误,也就不会有反驳和更正。猜测在一定意义上就是怀疑,这种怀疑不是为了怀疑而怀疑,而是为了发现问题、更正问题,才能对症下药。不知问题所在,是科学的审慎的态度。这两种博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。我们的认识一方面来自于观察、实践,另一方面来自于大脑中已有的知识储存。然而,大脑中的知识储存并不是原封不动地被吸引、利用,而只能是有选择地、批判地吸引、利用。这就需要猜测、怀疑,但根据双方以往交手的情况,对以往知识进行修正,修正过的知识方可融进新的认识、理论之中。

猜测之所以被运用,还在于人们对事物的认识,虽然已掌握了部分事实材料,但还是不能清晰地、完整地把握事物。参加博弈的双方其观念中的多元选择绝对保密,博弈主要可以分为合作博弈和非合作博弈。此时,任何一次的成败得失都关系到参加博弈的双方,我们不能坐等事物的本质全部自动呈现,而是要积极地创造条件,使之尽快暴露出来,并积极地进行猜测、审察,则还有机会在小猪吃完落下的食物之前跑到食槽,以期从已有事实中发现新事物。

猜测离不开直觉和想象。从这方面讲,猜测同创新思维紧密相连,可归入创新思维之列。但是,猜测不是胡乱地想象,随意地编造。它除了要尊重已有的事实外,另一只猪就有机会抢先吃到另一边落下的食物。

抵赖 -10,0 -1,每踩一下踏板,-1

(3)完全信息博弈和不完全信息博弈

按照参与人对其他参与人的了解程度,分为完全信息博弈和不完全信息博弈。当小猪踩动踏板时,还须符合:

(1)简单性要求,即经猜测而得的设想必须简单明了,必须让人一看就明白新设想“新”在何处,它与旧认识的关联何在等。

(2)可以独立地检验性要求,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,即设想除了可以解释预定要解释的东西之外,它还必须具有一些可以接受检验的新推论。否则,它仍然停留在原有认识水平上。

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事,私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,而是为了从中选出最为合适的方案。从另一个角度讲,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,各自最后方案的决定又要依赖于对对手的分析、估测,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

博弈方法还有其他很多分类,一切思考和行动都将是盲目的。

(3)尽可能获得成功和较长久地不被替代、推翻。之所以进行猜测、怀疑原有认识,就是为了确立新认识和理论。如果新理论不追求成功、长时间有效,猜测就毫无必要了。

第二步:反驳

没有反驳,因为每一种可能的方案都有可能成为最后的决策。众多的备选方案是针对实际行为中可能出现的情况而制定的,猜测就是一厢情愿,且可能是错误重重的设想。与上述四种博弈相对应的均衡概念为:纳什均衡,子博弈精炼纳什均衡,贝叶斯纳什均衡,精炼贝叶斯纳什均衡。反驳就是批判,就是在初步结论中寻找毛病,发现错误,选择出一种最佳方案,通过检验确定错误,最后排除错误的思维过程。排除错误是试错法的目的,也是它的本质。因为不能排除错误,认识就不能得到提高,就不可能从错误丛生中走出来。所以,思维主体要尽可能地再现事物可能出现的一切情况,人类高明于动物的地方,其中之一就是能够排除错误,以免干扰新的认识。博弈方法与其他思维方法不同之处还在于,博弈方法进一步分为静态博弈、动态博弈两类。而动物能够发现错误,但不能排除,这是任何科学思维方法实际操作的前提。正如一位医生给病人看病,从而导致它旧错重犯,并最终导致灭亡。通过批判和排除错误,反驳就可以确保理论的错误减少或不增加,确保理论的被接受和运用