书城投资零和游戏
19719300000012

第12章 复杂的失败(1)

在一个非零和的环境里,“城府森严”并不能显现“不测之威”。所谓“兵不厌诈”也并非有用的信条。相反,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。

有一个旅客首次搭乘客轮,他同船长聊起来:“船长先生,你对河中每一处险滩,一定都知道得一清二楚。”

船长说:“我对河中的险滩并不全部清楚。”

旅客惊讶地问:“你不知道哪里有险滩,怎么能开船呢?”

船长说:“为什么一定要在险滩之间摸索呢?我知道深水在哪里,不就够了吗?”

人们往往喜欢将一件简单的事搞得复杂。在“囚犯困境”的游戏中,最有意思的就是人们对“一报还一报”的“复杂”改进。

清晰性是成功策略的要素

在第二轮游戏开始之前,参赛者们都得到了一份关于第一轮竞赛的详细分析报告,其中包括那些可以表现得很好的补充规则。因此他们不仅知道第一轮竞赛的结果,而且知道用于分析成功的思想和概念及所发现的易犯的策略性错误。而且,每个人都知道其他人也知道这些事。于是,人们开始利用自己的“聪明”,进行“一报还一报”的“改良”工作。因为谁都想借用这个成功的成果,为自己锦上添花。

为了向可能的参赛的人说明如何向比赛提交程序,艾克斯罗德曾提供了一个示范程序给可能参赛的人。事实上,如果有人简单地把这个规则剪下后寄来,它就可能赢得这次竞赛。可惜没有人这么做。结果,越是机关算尽,其表现越不理想。因为复杂的策略老是想要以复杂的方法试探对方的虚实,并伺机以背叛来占便宜。可是他们的背叛往往立即遭到报复,结果是搬起石头砸了自己的脚。

另一方面,过分复杂的策略使得对手难于理解,无所适从,无法建立稳定的合作关系。事实上,与零和游戏截然不同,在一个非零和的环境里,“城府森严”并不能显现“不测之威”,所谓“兵不厌诈”也并非有用的信条。相反,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。

而作为相对成功的“一报还一报”策略则充分表现出它的简单与清晰,这极易于为对手所了解,能让对方在三五步对局内辨识出来,太复杂的策略只会让对方摸不着路数。而“一报还一报”的清晰性,能让对方很快发现规律后,受到不可背叛的警示:背叛立即要受到报复。从而引导对方不得不采取合作的态度。

人们往往将复杂化推而广之到生活的各个层面,包括自己。每个人都像演戏一样扮演着各种角色,而不愿意或不能把自己真正的一面表现出来。因此,彼此认识的就永远是那个表面的“角色”了。因为不了解对方,我们就很难真正地喜爱或关怀对方;因为不了解我们,对方也很难真正地喜爱或关心我们,彼此之间,当然就很达成真正深刻而有意义的合作了。

在与人的合作中,清晰、简单、有连续性,让合作方明白易懂的策略往往是最优的。公开声明自己对合作所持的态度,并在任何时间、任何利益诱惑下都始终如一地坚持下去,才会使自己立于不败之地。朝令夕改,会令合作方无所适从。然而囚犯困境并不是这样,不像老天下雨,对方对你的行为是有反应的,也不像下棋的对手,在囚犯困境中的对方不应该被认为是一心想背叛你的。对方将把你的行为看成你是否回报合作的信号。

因此,你自己的行为将会反射到你的身上。

聪明的失败

有一个农民,十分勤劳。他有一个菜园。有一天,他发现地里长了一个大南瓜。由于他从来没看见过那么大的南瓜,所以又惊奇又高兴。他想了想后,决定把这个大南瓜送给国王。

于是,他带着礼物去见国王了。国王很满意,赠给农民一匹马,以示感谢。农民大喜,接受了礼物,谢了恩,就回家了。

全城都知道了这个消息。一个富人想:农民送了一个南瓜,就得到那么丰厚的礼物,那么我送给国王一匹骏马,他会赠给我什么呢?

于是,富人选了一匹最好的马,牵到王宫里,送给国王。

国王明白了富人的奸计。他接受了礼物,道了谢,接着叫仆人来,说:“就是这个人给了我一匹好马,我决定回赠他农民送来的一个大南瓜。”

复杂的方式通常意味着对方要经常采用试探性的背叛来表明它不会被引诱而合作,但是问题的关键是这些最大化规则没有考虑到它自己的行为会引起对方的变化。

我们知道,在“囚犯困境”的第二次对弈局中最主要的特点就是,倾向于对“一报还一报”做一些改进,以识别并用总是背叛对付那些似乎随机的和非常不合作的家伙。但这些想法的实现并没有比原本的“一报还一报”表现得更好。竞赛结果表明在囚犯困境的情况下人们容易耍小聪明。人们对“一报还一报”策略的“精心修订”,不过是处心积虑地试图得到更多投机与背叛的机会而已,它们经常陷入双方背叛。这些规则的共同问题是,使用一些复杂的方法来推断对方。而这些推断常常是错误的。这种使事情变得复杂的方式使得这些策略最终走向失败。

就如上面故事中的富人汲取了农民的成功策略“改进”后的结果是吃了亏一样,他所不具有的正是农民对国王的善意。

在“困境”的游戏中,试图使得分最大化的规则大多是把对方看做是环境的一个不变的部分,而忽略了彼此的相互作用,不管他们在有限的假设下所做的计算是多么的聪明。如果你离开对方适应你,你适应对方,对方又适应于你的适应这样一直下去的反应过程去模拟你的对方,那么你的聪明是不会有好结果的。这是一条充满成功希望的艰难的路,显然在两次竞赛中没有一个复杂的规则精于此道。

复杂的方法并不能逃脱惩罚

还有一些不善良的规则,试图使用相当复杂的方法来“钻空子”——试探它是否能逃脱惩罚。其中有两个程序就试图利用这样的方式取得成功。其中一个程序名为“检验者”,它的做法是,尝试在第一步背叛,如果对方报复的话,它就马上撤回。

还有一个程序名为“镇定者”,它的方式是倾向于在背叛前等待十几步,看看对方是否能被哄骗和被偶尔占便宜。如果是的话,“镇定者”就更频繁地增加背叛次数,直到对方反击而被迫撤回。但是这些尝试道德背叛的策略结果表现得并不怎么好。这是因为存在许多由于愿意报复而不愿被占便宜的策略,所以基于零和思维导致冲突的代价有时是很高的。

即便是许多熟知囚犯困境的专家也没有意识到,善良性对避免不必要冲突所具有的价值。在第一轮竞赛中,由博弈论专家送来的规则中几乎有一半是不善良的。参考了第一轮的明显结果,第二轮比赛中大约有l/3规则采用不善良的策略,但是它们都没有占到便宜。

要知道,在游戏中采用的策略越复杂,就越加显得杂乱无章。反过来,如果你过于简单地采用一个随机的策略,对方就找不到你反应的规律,因此也可以将你视为不反应的,也就感受不到与你合作的激励。

因此,复杂到不可理解也同样是非常危险的。

当然,在许多人类事务中,一个使用复杂规则的人可以向对方解释每一个选择的理由。然而,问题出现了:对方可能怀疑这些被提供的理由,因为它们是如此复杂,显得好像是专门为这个场合设计的。正如人们常说的“太像真的,反而是假的了”。在这种情况下对方当然会对你采取合作的态度,因此会把一个显得不可预测的规则看成不可改造的,结果自然是导致背叛。

而“一报还一报”策略在竞赛中的清晰性,使它非常容易被对方理解。当你使用“一报还一报”策略时,对方有很好的机会去理解你在干什么。你对任何背叛的一对一的反应是一个很容易被意识到的模式。

而且你的未来行为是能被预测的。一旦这些情况发生了,对方能容易地发现应付“一报还一报”的最好方式就是与其合作。假设这个游戏有足够的可能继续下去,至少还有下一步相遇。那么当你遇到“一报还一报”策略时只有马上和他合作是最好的选择,这样你将可以在下一步得到合作。

在零和游戏(如下围棋)和非零和游戏(如重复囚犯困境)之间有一个重要的不同。在下围棋时,让你的对手猜疑你的企图是很有用的。但是在非零和情况下,如此聪明不总是有好处的。在“重复囚犯困境”中,你要从对方的合作中得到好处。诀窍在于鼓励合作,一个好的方式就是清楚地表明你愿意回报。大家都知道行动比言语更可信。这就是“一报还一报”之所以如此有效的原因。

自设的陷阱

接下来我们要讲述的这个寓言就是有关一个“聪明”祭司的“聪明”行径。

要知道,祭司在主持宗教仪式之前必须先洗澡。

有时宗教仪式在早晨5点举行,而在这个时候之前洗澡是很难受的。

有一个祭司,他最害怕大清早就跳到冰凉的水里去洗澡。冬季的一天,祭司要在早晨5点主持一个仪式。

当时天气很冷,他没有像宗教经典所要求的那样跳到水里去洗澡,只用湿布擦一擦身子,然后就去主持仪式了。有些人对他产生了怀疑,问他是否洗过澡。

“我在10分钟以前洗的。”这个祭司说。

可人们发现他的头发是干的,因此,把他赶了出去,请来另一个祭司主持仪式。

几天以后,巴德马那伯到另一家去主持宗教仪式。这次他十分小心,把头发弄湿了,然后就到那一家去了。

有些入对他又产生了怀疑,问他洗过澡没有。他说:“是的,洗过了,你们看我的头发。”

一些挑刺儿的人用手抓抓他的头发,说:“你们看,他的头皮是干的,他只是把头发弄湿了。”于是,他又被赶了出去,换了另一个祭司来主持仪式。

这位可怜的祭司去找朋友诉苦,说:“我该怎么办呢?有什么好办法吗?”

其实,办法很简单,事情应该怎么做就怎么做,这样,就再也不会被赶出来了。本来很简单的事情让祭司弄得异常复杂。问题在于,人们往往总是希望作一点弊,哪怕它更吃力不讨好。这种自设的陷阱只会为自己带来更多的麻烦。

这个世界之所以有那么多的麻烦,恐怕应验了“世间本无事,庸人自扰之”的古语。

恩怨必报

一个程序要维持声誉,说报复就一定要做到,无论是背叛还是合作都要做出相应回报,人家才知道你是不好欺负的。才不敢不与你合作。

朱哈精心饲养了一只大肥羊,等着冬天到来时把它宰了,好美美地吃上一顿肥羊肉。他的邻居和朋友想开开他的心,想方设法要把大肥羊偷走,可是几次都没有得手。于是,他们一商量,想出了一条计策。

一天,其中一个人来到朱哈那里,对朱哈说:“朱哈,明天至多后天就是世界末日了,你还留着大肥羊干什么,倒不如把它交给我们宰了,大家趁早美美地吃上一顿!”

朱哈没有答理他。可是,其他的人一个接一个来找他,都是说世界末日快到了,劝他趁早宰羊。朱哈被他们说得心烦了,就答应明天宰羊,请他们吃一顿丰盛的羊肉野餐。

第二天,朱哈在野外宰了大肥羊,搭起架子升起火来烤羊肉。邻居和朋友们很高兴,纷纷脱下外衣,堆在一起交给朱哈看管,然后远远地走到一边儿去玩,没有一个人留下来帮朱哈的忙。朱哈心里很不高兴,于是捧起堆在地上的外衣,统统扔进了火里。

邻居和朋友们回来后,发现他们的外衣全都烧成了灰,气得七窍生烟,齐声大骂朱哈。朱哈看着他们,心平气和地说:

“你们不是说今天至多明天就是世界末日吗?既然如此,人的性命都保不住了,还要外衣干什么!”

好的善良规则要具有报复性

对于那些总是伺机占便宜的人而言,朱哈只有以烧掉他们的衣服以警示性报复,否则这些人占过一回便宜,下次还要想办法来讨好处。

我们知道,一个策略的善良性与否是区分成功与失败的“分水岭”,但并不是每个善良的规则都能得到好报,一味地善良只能毁灭自己。

对于善良的规则而言,决定它们能否生存下去的要素,要看它们如何迅速而可靠地对来自对方的挑战做出反应。也就是说要有一定的“报复性”。否则,一个投机者的策略将很容易地从这样一个好说话的策略身上获得越来越多的好处。就像那个仁心的东郭先生一样,若不是猎人及时出现,恐怕早成了狼的腹中之食了。对付“检验者”和“镇定者”这类“投机性聪明”的策略规则,最好办法是时刻准备报复来自对方的“无缘无故”的背叛。

善良能得到好处,报复也能得到好处。一个程序要维护声誉,说报复就一定要做到,无论是背叛还是合作都要做出相应回报,人家才知道你是不好欺负的,才不敢不与你合作。一个善良规则必须能够被对方的第一次背叛所激怒。不过,这个反应不需要是即刻的,而且也不必一定要发生,但它必须要有一个警示的作用。重要的是不能使对方受到背叛所带来好处的激励。

迅速反应才能维护自己的权利

“一报还一报”超常的成功正是在于它的回报性。在第一步合作之后,“一报还一报”只是简单地回报对方在上一步的行为。这个简单的规则惊人地有效。它从不首先背叛,但是不管过去相处的关系如何好,它总能被一个背叛所激怒,而迅速做出反应。

为什么要对对方的挑战迅速反应?原因之一在于你要维护自己的权利。