第8章经济学不是教你诈：不可不知的博弈论 (1)

有限理性——我们并不总是聪明人

【经济学释义】

有限理性的概念最初是阿罗提出的，他认为有限理性就是人的行为“即是有意识地理性的，但这种理性又是有限的”。一是环境是复杂的，在非个人交换形式中，人们面临的是一个复杂的、不确定的世界，而且交易越多，不确定性就越大，信息也就越不完全；二是人对环境的计算能力和认识能力是有限的，人不可能无所不知。

【与读者侃经济】

在经济生活中，我们都是理性的人，只不过这种理性一般是有限理性。有个关于餐具的测试：一家商店正在清仓大甩卖，有一套餐具，有8个菜碟、8个汤碗和8个点心碗，共24件，每件都完好无损。同时有一套餐具，共40件，其中有24件和前面那套的种类大小完全相同，也完好无损，除此之外，还有8个杯子和8个茶托，不过2个杯子和7个茶托已经破损了。在这种情况下，人们愿意为第二套餐具比第一套多出了6个好的杯子和1个好的茶托，但人们愿意支付的钱却反而少了。

人们往往有这样的心理：一套餐具的件数再多，但即使只有一件破损的，人们就会认为整套餐具都是次品，理应价廉；而件数再少，但却全部完好，也就成为理所当然的合格品，当然应当高价。可以说，这是理性人的不理性，即“有限理性”。

在生活中我们因为有限理性而对“得失”的判断屡屡失误，如工人体育场将上演一场由罗大佑、周华健等众多明星参加的演唱会，票价很高，需要800元，这时你梦寐以求的演唱会，机会不容错过，因此很早就买到了演唱会的门票。演唱会的晚上，你正兴冲冲地准备出门，却发现门票没了。要想参加这场音乐会，必须重新掏一次腰包，那么你会再买一次门票吗？假设是另一种情况：同样是这场演唱会，票价也是800元。但是这次你没有提前买票，你打算到了工人体育场后再买。刚要从家里出发的时候，你发现自己不知什么时候把刚买的价值800元的MP4给弄丢了。这个时候，你还会花800元去买这场演唱会的门票吗？

与在第一种情况下选择再买演唱会门票的人相比，在第二种情况下选择仍旧购买演唱会门票的人绝对不会少。客观来讲，这两种情况是没有区别的，是等价的：在你愿意花800元钱去听演唱会的前提下，你面临的都是损失了价值800元的价值，然后你需要选择是否再花800元去参加演唱会。只不过在两种情况下你的损失形式不同：在第一种情况下，你是因为丢了一张票而损失了800元，而在第二种情况下你是因为丢了800元的MP4而损失了800元。

同样是损失了价值800元的东西，为什么我们大多数人会有截然不同的选择呢？其实对于一个理性人来说，他们的理性是有限的，在他们心里，对每一枚硬币并不是一视同仁的，而是视它们来自何方、去往何处而采取不同的态度，这是一种非理性的情况。

帕累托最优——任何人都不愿改变的最佳状态

【经济学释义】

所谓帕累托最优，指的是资源分配的一种理想状态。一旦达到了这种理想状态，想要使某些人的处境变好，就必定要使另外某个人的境况变坏。相反，如果还可以在不损害其他人的情况下改善某个人的处境，我们就可以认为资源尚未被充分利用，这时就没有实现帕累托最优。

【与读者侃经济】

根据帕累托的说法，如果社会资源的配置已经达到任何调整都不可能在不使其他人境况变坏的情况下，使任何一个人情况变更好，那么，这种资源配置的状况就是最佳的，是最有效率的。如果没有达到这种状态，即任何重新调整而使某人境况变好的，而不是其他任何一个人情况变坏，那么说明这种资源配置的状况不是最佳的，是缺乏效率的。

试举一例。球迷们去体育场观看一场精彩的足球比赛，球场能坐50000人。假如在比赛开场前，坐到了49000人，那么，体育场在此时还没有处在“帕累托最优”的状态，因为如果再进入1000名球迷，他们也可以看到比赛，即“他们的处境会变得更好”，这个增加球迷的过程就是“帕累托改进”。但是如果已经坐满了50000人，如果再进入1000名甚至更多的球迷，这些新增加的球迷可能会因为看到球赛而使“自己的处境变好”，但对于那原有的50000名观众来说，处境却会变差，原因很简单，超过规定人数，安全性就受到损害了。

同样的情况也适用于长途汽车。在没有满员的情况下，可以再上乘客，以达到“帕累托最优”。但是满员后再超载，全体乘客的安全就会受到影响，此时就不是“帕累托最优”了。

在某种意义上，我们可以认为，帕累托最优是一个兼顾公平与效率的“理想王国”。在经济学上，“帕累托最优”无疑是一颗闪烁着迷人光泽的宝石。在这种状态下，每个人均不会为了自己的利益而损及他人，最终将实现社会的充分富裕。由此看来，帕累托最优确实令人神往。但是，需要指出的是，在经济学上，“帕累托最优”描述的是一种过于理想化的状态，在现实的经济生活中比较难以达到。为了达到“帕累托最优”，所以便有了“帕累托改进”。“帕累托改进”是指在没有使任何人处境变坏的前提下，使得至少一个人的处境能变得更好。

“帕累托改进”的特点是自己变好，同时又不使他人变差。正是由于“帕累托改进”没有损害到他人的利益，其行为所遇到的阻力往往很小。以我国初期的改革开放为例，其政策大多都是帕累托改进，比如“分田到户”和“联产承包责任制”，它们的特点是广大农民获得了切实的好处，而其他行业也没有受到什么损失，所以推行起来阻力不大。但是如果不是帕累托改进的话，即在使一部分人变好的同时，肯定会使另一部分人变差，阻力就会增大。

在工作生活中，就要学会合理利用帕累托效率准则。当你的资源配置达到最佳状态时，只需要保持就能实现效益最大化。

囚徒困境——理性人的两难选择

【经济学释义】

囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益，但在信息不明的情况下，因为出卖同伙可为自己带来利益。这种困境反映了个人理性与集体理性和之间的矛盾，对每个人而言都是理性的选择，能得到最优的结果，但对于整个集体来说却是非理性的，最终导致对集体中每个人都不利的结果。

【与读者侃经济】

1950年，担任斯坦福大学客座教授的数学家图克，为了更形象地说明博弈过程，他用两个犯罪嫌疑人的故事构造了一个博弈模型，即囚徒困境模型：

警方在一宗盗窃杀人案的侦破过程中，抓到两个犯罪嫌疑人。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点东西。警察缺乏足够的证据指证他们所犯下的罪行，如果罪犯中至少一人供认罪行，就能确认罪名成立。

于是警方将两人隔离，以防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人中有一人认罪，则坦白者立即释放而另一人将判8年徒刑；如果两人都坦白认罪，则他们将被各判5年监禁；当然若两人都拒不认罪，因警察手上缺乏证据，则他们会被处以较轻的偷盗罪各判1年徒刑。

那么，两个罪犯会怎样选择？

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；即使他们能交谈，也未必能够尽信对方不会反口。

那么在困境中任何一名理性囚徒都会做出如此选择：

若对方选择抵赖，自己选择背叛，会让自己获释，所以会选择背叛。

若对方选择背叛，自己也要背叛，才能得到较低的刑期，所以还是选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑5年。

这就是博弈论中经典的囚徒困境，可用下表表示。

囚徒困境

甲/乙坦白抵赖

坦白 -5，-5 -8，0

抵赖 0，-8 -1，-1

囚徒困境是博弈论的非零和博弈中具有代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

囚徒困境假定每个参与者都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑5年的情况好。但根据以上假设，两人均为理性个人，且只追求个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是困境所在。

每个人想到的都首先是自己的利益，进行的都是有利于自己的选择决策，但最后的结果，往往都没有使自己获利，大家都没有从中获得好处。

纳什均衡——鹦鹉需要学的“新词”

【经济学释义】

纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成，即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。

【与读者侃经济】

“纳什均衡”的创立者约翰·纳什的名字是因为那部获奥斯卡奖的影片《美丽心灵》才被大家了解的。这个被精神分裂症困扰了30多年的天才曾被很多学术奖项和机构排斥在门外，他的诺贝尔奖得来的更是艰难。他在20世纪80年代中期即出现在候选人的名单当中，却因为两派意见相差太大而被搁置了近10年。1994年，他终于在投票中以微弱多数通过，获得当年的诺贝尔经济学奖。

在进化博弈论方面相当有造诣的坎多利对保罗·萨缪尔森的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家，因为它必须学习的只有两个词，那就是‘供给’和‘需求’”，曾做过一个幽默的引申，他说，“现在这只鹦鹉需要再学新词，那就是‘纳什均衡’”。

在经济生活中，纳什均衡其实就在我们身边。在纳什假定的情景下，如果四位优秀的男士看到四位美女加一绝色美女，通常每一位男士都会假定其他男士会去追绝色美女，故追到绝色美女的不确定性最强，很难有最优机会；为防止“赔了夫人又折兵”，每一位男士去追的将是普通美女。普通美女与绝色美女相比，比较知道自己的差距，在有确定追求者的时候，会有清晰的迎合策略。因此相比较于绝美的不确定策略，普通美女会更具吸引力，结果会导致绝色美女轮空或无人敢认真追她。

如果按照Ⅰ、Ⅱ、Ⅲ、Ⅳ给男女划个等级，那么现实中的典型配对是：Ⅰ男配Ⅱ女，Ⅱ男配Ⅲ女，Ⅲ男配Ⅳ女。在大伙的“谦让”之下，Ⅰ女即鲜花美女将轮空，所以Ⅳ男即“牛粪”可能出于无聊或其他动机去追Ⅰ女“鲜花”。

Ⅰ女“鲜花”一般是不追人的，所以丧失了主动、选择性地获得优秀男士的机会。而最有可能追鲜花的是Ⅳ男即“牛粪”，这极大限制了“鲜花”的选择范围。除非鲜花明白了这个道理，自我破解，否则就很难走出这个近乎宿命的“鲜花插牛粪”困境，从而实现相对较优的组合。

由此可见，均衡是指一种均势的状态，在经济生活中，是各方参与者在理性预期的指导下综合博弈的结果。假如我们理解了其中的奥妙，生活就不会平添许多无谓的烦恼。

第8章 经济学不是教你诈：不可不知的博弈论 (1)

第8章经济学不是教你诈：不可不知的博弈论 (1)