书城经济经济学常识1000问
3202800000014

第14章 博弈(4)

古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果一个猎人单兵优作战,一天最多只能打到4只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天不挨饿,而一只鹿却能让两个人吃上10天。这样两个人的行为决策可以形成两个博弈结局:分别打兔子,每人得4;合作,每人得10。这样猎鹿博弈有两个纳什均衡点,那就是:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。

显然,两个人合作猎鹿的好处比各自打兔子的好处要大得多,但是要求两个猎人的能力和贡献相等。如果一个猎人的能力强、贡献大,他就会要求得到较大的一份,这可能会让另一个猎人觉得利益受损而不愿意合作。“合则双赢”的道理大家都懂,在实际中很难合作的原因就在于此。合作要求博弈双方学会与对手共赢,充分照顾到合作者的利益。

什么是诺斯悖论?

“诺斯悖论”是诺斯在1981年提出,国家具有双重目标,一方面通过向不同的势力集团提供不同的产权,获取租金的最大化;另一方面,国家还试图降低交易费用以推动社会产出的最大化,从而获取国家税收的增加。国家的这两个目标经常是冲突的。另外,由于存在着投票悖论、理性的无知,加之政治市场的竞争更不充分和交易的对象更难以考核等因素,政治市场的交易费用高昂。结果,政府作用的结果往往是经济增长的停滞。

何谓囚徒困境?

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

其内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判2 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

多次重复的囚徒困境,和单次发生的囚徒困境结果不会一样。在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。

什么是生日悖论?

生日悖论(Birthday paradox)是指,如果一个房间里有23个或23个以上的人,那么至少有两个人的生日相同的概率要大于50%。这就意味着在一个典型的标准小学班级(30人)中,存在两人生日相同的可能性更高。对于60或者更多的人,这种概率要大于99%。从引起逻辑矛盾的角度来说生日悖论并不是一种悖论,从这个数学事实与一般直觉相抵触的意义上,它才称得上是一个悖论。大多数人会认为,23人中有2人生日相同的概率应该远远小于50%。计算与此相关的概率被称为生日问题,在这个问题之后的数学理论已被用于设计著名的密码攻击方法:生日攻击。

什么是三门问题?

三门问题(Monty Hall problem),是一个源自博弈论的数学游戏问题,大致出自美国的电视游戏节目Let"s Make a Deal。问题的名字来自该节目的主持人蒙提·霍尔(Monty Hall)。

这个游戏的玩法是:参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门就可以赢得该汽车,而另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机会率?如果严格按照上述的条件的话,答案是会—换门的话,赢得汽车的机会率是 2/3。

这条问题亦被叫做蒙提霍尔悖论:虽然该问题的答案在逻辑上并不自相矛盾,但十分违反直觉。这问题曾引起一阵热烈的讨论。

何谓少数者博弈?

少数者博弈(Minority Game):生活在社会群体中的人们常常会遇到这样的问题,也就是有许多决策人同时面临两种选择,如果决策人的选择是较少人选择的,就将获益;否则肯定会失利。在不考虑道德因素的前提下,决策人如何决策,这就是少数者博弈问题

什么是胜者全得博弈?

胜者全得博弈是指支付策略取决于对其他竞争者或参与人而言的相对价值而非绝对价值。这类博弈的一般特征是:回报主要或完全集中于那些最优的竞争者。

如果在博弈中,收益不是依据绝对价值而是依据相对价值,并且收益主要或者完全集中于博弈中的获胜者,那么此博弈即为胜者全得博弈。

在胜者全得博弈中,获得冠军的人一般都拥有极好的天赋,他在竞争中获胜并得到绝大部分收益,而亚军得到的收入将少得多。例如在体育比赛中,一个冠军可能获得50万美元甚至更多的奖金,而亚军可能只获得10万美元左右的奖金,其余的人收入则更差。但是,由于有高额的奖金在刺激着获胜者,每个人都渴望自己能获得成功,于是,很多人就参与到这场竞争中。

什么是秃子悖论?

秃子悖论认为:如果一个有X根头发的人被称为秃子,那么,有X + 1根头发的人也是秃子。所以,(X + 1) + 1根头发的还是秃子。以此类推,无论你有几根头发都是秃子。

显然,这个结论是错的。当一个结论是错的时候,其推理或是至少一个前提是错的。那么,错在哪里?

这种错误其实并不容易被清楚的点出来。因为,这是一种结构误植所造成的错误。简单的说,一个词汇的习惯用法被不当的放在另一个不同的结构中。在我们的日常生活中,我们判定一个人是秃子与否不是用确定的头发数量衡量,而是一种大致上的感觉。所以,秃子这个概念的结构不同于那种可以被清楚量化的概念的结构。所以,当我们要用一根一根去计较一个人是否是秃子时,就会产生问题。你可以责怪秃子的概念不够科学,你也可以责怪科学不适用于这类的概念。

并不是所有的概念都可以被科学清楚的定义,日常生活概念的结构不同于科学概念的结构。但是这类问题不太容易被清楚点出来,因为我们很少去注意所谓的概念结构。

你知道污染博弈吗?

假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。

如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。

什么是有限次重复博弈?

有限次重复博弈是指相同结构的博弈有限次重复进行。在有限次重复博弈中,参与者会欺骗和违约,但当参与者不知道哪一次是末期时,决策近于无限次博弈。

如果是有限期的重复博弈,情况就有所不同了。用逆推法来分析博弈过程,可以表明,参与者若明确合作到了最后一期,以后不会再有重复博弈,那么,最后一期的博弈和一次性的博弈就没有区别,参与者的欺骗和违约行为是不可能被报复的,于是最后一期单个参与者的占优策略就是不合作的欺骗或违约。逆推到前一期,每个参与者都推知以后将不合作,所以也不会合作。如此等等,在有限次重复博弈中,囚犯困境博弈的纳什均衡是参与者的不合作。

例如,一个男孩被视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?”,男孩小声回答:“假若我拿了1角钱的硬币,下次他们就不会拿钱让我选了。”

什么是用餐者困境?

在博弈论中,用餐者困境是一个多参与者的囚徒困境。设想的情景是有若干人出去吃饭,在点菜之前他们达成了一致:所有人平摊买单的钱。现在,每个人要么点贵的菜肴,要么点便宜的菜肴。假设贵的菜肴比便宜的要好,但是如果一个人单独进食的话,不能保证为贵的菜肴多付的钱一定值得。每个人都这么推想:众人将会点便宜的菜肴,而由于点了更贵的菜肴而额外加的钱将被众人摊分,所以额外加的钱是很少的,而菜肴的味道却会有较大的改善,因而多花这点钱是划算的。每个人都这样推想,最后的结果是他们都花钱点了更贵的菜肴,而原本他们认为点便宜的菜肴要比点贵的对每个人都要好些。

何谓智猪博弈?

智猪博弈的模型解析如下:假设猪圈里有一头大猪、一头小猪,它们在同一个石槽里进食。猪圈的一侧有猪食槽,另一侧安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,大小猪收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

小猪选择等待,大猪去按控制按钮的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本)。而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动。在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1个单位。如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

在智猪博弈模型中,反正受罪的都是大猪,小猪等着就行。智猪博弈模型可以解释为谁占有更多资源者,谁就必须承担更多的义务。

什么是“博傻理论”呢?

博傻理论是指在资本市场中,如股票、期货市场,人们之所以完全不管某个东西的真实价值而愿意花高价购买,是因为他们预期会有一个更大的笨蛋会花更高的价格从他们那儿把它买走。

“博傻理论”所要揭示的就是投机行为背后的动机,投机行为的关键是判断“有没有比自己更大的笨蛋”,只要自己不是最大的笨蛋,那么自己就一定是赢家,只是赢多赢少的问题。如果再没有一个愿意出更高价格的更大笨蛋来做你的“下家”,那么你就成了最大的笨蛋。

1720年,英国股票投机狂潮中有这样一个插曲:一个无名氏创建了一家莫须有的公司。自始至终无人知道这是一家什么公司,但认购时近千名投资者争先恐后把大门挤倒。没有多少人相信他真正获利丰厚,而是预期有更大的笨蛋会出现,价格会上涨,自己能赚钱。饶有意味的是,牛顿参与了这场投机,并且最终成了最大的笨蛋。他因此感叹:“我能计算出天体运行,但人们的疯狂实在难以估计。”

激励有哪些类型?

不同的激励类型对行为过程会产生程度不同的影响,所以激励类型的选择是做好激励工作的一项先决条件。

1.物质激励与精神激励

虽然二者的目标是一致的,但是它们的作用对象却是不同的。前者作用于人的生理方面,是对人物质需要的满足,后者作用于人的心理方面,是对人精神需要的满足。

2.正激励与负激励

正激励与负激励作为激励的两种不同类型,目的都是要对人的行为进行强化,不同之处在于二者的取向相反。正激励起正强化的作用,是对行为的肯定;负激励起负强化的作用,是对行为的否定。

3.内激励与外激励

所谓内激励是指工作任务本身的刺激,即在工作进行过程中所获得的满足感,它与工作任务是同步的,会产生一种持久性的作用;所谓外激励是指工作任务完成之后或在工作场所以外所获得的满足感,它与工作任务不是同步的,所以难以持久。

负激励有哪些要求?

1.负激励的执行不能产生偏差。

在宪法中规定“法律面前人人平等”,负激励也是如此。负激励一旦产生偏差,员工就会斤斤计较,会导致企业管理者的权威受损,甚至导致企业管理制度形同虚设。

2.在负激励面前管理者要以身作则。

作为企业的领导阶层,管理者要舍得“亏”自己,要陪同员工接受应负担的责任,让员工心服口服。

3.正确把握负激励的力度和尺度。

过于严厉的负激励措施容易伤害员工的感情,抹杀员工创新能力和积极性;过于松散的负激励措施起不到震慑作用,达不到预期目的。因此,负激励的运用一定要注意把握一个“度”,对于不同的员工群体,有时还要区别对待。

4.物质负激励与精神负激励相结合。

物质负激励与精神负激励都是负激励不可或缺的组成部分,相辅相成。两者结合可以产生更好的效果。