书城励志最神奇的博弈论定律
175900000049

第49章

第十二章为思想准备一支机动部队:

第一节随机博弈定律

某警察部门负责城市某一区的治安,要对该区的A、B两地进行巡逻。假定该区的一群小偷准备行窃,警察要防止小偷行窃,但因为设备有限,只有一部警车,因此,警察只能一次在一个地方巡逻。而对于小偷而言,他们也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1万元。若警察在某地进行巡逻,而小偷也选择去该地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地巡逻,而小偷选择去该地,则小偷偷盗成功。在这种情况下,警察怎么巡逻才能使效果最好呢?

若警察对A地进行巡逻,小偷去B地,这样警察可以保证2万元的财产不被偷窃,小偷得益1万元。

若警察与小偷都在同一地点,小偷无法实施偷盗,则此时小偷的得益为0(没有收益),警察的得益为3(保住3万元)。

但是这种做法是警察的最优做法吗?有没有对这种策略改进的措施?

这个博弈是混合策略博弈,它没有纯策略纳什均衡点。这个混合策略均衡点下的策略选择是每个参与者的最优(混合)策略选择。

对于这个例子,警察的最优做法是,用掷骰子的方法决定去A地还是B地。假定警察规定掷到1~4点去A地,掷到5、6两点去B地,这样警察有2/3的机会去A地,1/3的机会去B地。

而小偷的最优选择是:以同样掷骰子的办法决定去A地还是去B地偷盗,只是掷到1~4点去B地,掷到5、6两点去A地,那么,小偷有1/3的机会去A地,2/3的机会去B地。

此时警察与小偷所采取的便是混合策略。

按这一策略警察此时的期望得益是7/3万,大于2。警察按此办法比只巡逻A地收益更大。

而小偷的收益是:一旦警察采取混合策略,小偷也采取混合策略,其最优混合策略下的收益为2/3万元。

因为:当警察去A地巡逻时,小偷有1/3的机会去A地,2/3的机会去B地,此时,警察A地的得益为:(6+1/3)×3+2/3×2=7/3万元;当警察去B地时,同样小偷有1/3的机会去A地,2/3的机会去B地,此时警察A地的得益为:1/3×1+2/3×3=7/3万。警察总的得益为:2/3×7/3+1/3×7/3=7/3万。同理,可得小偷的总得益为2/3万元。

警察与小偷之间的博弈,如同“剪刀——石头——布”的游戏,在这个游戏中,不存在纯策略均衡,对每个人来说,自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略。如果对方知道你用其中一个策略的可能性大,那么你在游戏中输的可能性就大。