人与人之间的博弈,要尽量利用对手行为的可测性,并尽可能让对方猜不中你的模式。简单地说就是一面藏拙,一面利用对手的弱点。
让我们来玩一个游戏,我的一只手里藏着1块小石子,双手握拳,伸向两边,请你猜石子是在左手还是在右手?
如果你猜对了就赢1元钱,猜错我就输给你1元钱。
这个游戏就是一个“零和游戏”,不是我赢就是你输;反之亦然。输赢的几率好像一半一半,看起来不用任何技巧。
但这只是头几次的状况,随后你慢慢会发现我个人的习惯与偏好,比如我习惯把石头藏在右手,或者每玩一次就换手等等一些特征,你赢得几率就要加大。这并不奇怪,在日常“石头、剪刀、布”的游戏中并非概率平均分配,尤其在许多次后,总有善于猜测对方的人获得更多的胜局。
反过来,我也会注意到你的一些特点,比如你猜左手的次数多一些,或每次都换手猜等等,这样我也有机会把你痛“宰”一顿。
当然你也可做得隐蔽些,一时让我难以找出规律,那么对我而言,最好也同样不要露出马脚,否则必会输得很惨。不管对哪一边来说,注意对方无意中显露的习惯行为,都会十分有利。
这个游戏的最佳策略就是尽可能找出对手行为的规律,自己则随机出招:尽量利用对手行为的可测性,并尽可能让对方猜不中你的模式。简单地说就是一面藏拙,一面利用对手的弱点。所有竞赛游戏都是这样,游戏者都尽量使用出其不意的招式以突破对手的思维惯性。但请注意的是,如果每次都在出其不意时使出绝招,这也能成为一种行为规律。
假如双个人在玩石子游戏时都很成功,不露破绽,那么从概率上讲,最后他们会打成平手。信息论创始人数学家香农曾发明了一个猜测机器来跟真人对决,这个机器成功击败了许多真人,因为人们永远无法隐藏自己的思考模式。不过,最后还是输给一位企业总裁,因为这位总裁的思考是相当随机的,也就是毫无规律可言。
现在让我们来玩一个更高级一点的游戏,这个游戏需要两个参与者,就甲和乙吧。
首先我们将甲可能的策略以字母A到D来表示,乙的策略则为E到H。这是一个零和游戏,当甲乙双方的两个策略相遇时,赢得一方拿走相应的分值(就是下面表格策略交叉产生的数字来决定),而输的一方输掉相应的分值。由于双方都能看清楚自己的得失,所以这场博弈就开始了。
尽管游戏双方无法得知对方的选择,但他们还是得设法想出最好的策略来。
在这个游戏中乙很可能为了多赢一点而选择F,并希望甲能选A,这样乙就可以顺利拿到最高分10分。甲当然可以设身处地地猜得到乙的答案,所以决定选B,让对手只得到1分。
但乙考虑到甲可能看穿自己的想法,所以在策略上要保守一些,不过不管对方怎么做,乙的每一步都是设法将自己的利益最大化。首先乙可以观察每一横排,也就是自己可能的选择,比较每行最小的数字,因为这代表着甲相对的最佳结果,选择最小数字中最大的一行(即“最小数极大化”策略)?
依此逻辑,乙会倾向于选择E,因为该行最小的数字是5,表示选这一行最差的情况仍高于选其他行,这时候不论甲怎么选,乙的得分都不会少于5,但其他选择却可能因乙猜不透甲的想法而损失惨重。乙要做的就是在甲可能造成的伤害中,寻找冲击最小的,并尽量将冲击变成最有利的情况。这是很保守的策略,也称为“设想最坏状况”:并非追求胜利,而是避免失败。如果乙的目标正是力求不输,“最小数极大化”策略显然是最明智的。
再让我们从甲的角度来看这个游戏,他的目标当然是追求损失极小化,因此极可能采取“最大数极小化”策略,也就是他应该找出每一行中可能得到的最大数字,再挑选其中最小的。所以,他的策略和乙刚好相反。甲尽可能使自己最差的情况变得有利,并且了解乙也会选择对他自己有利的方案,不过他必须尽量让乙的努力落空。
对甲来说,各行最大数字中最小的一个就是C栏的5。这样乙怎么选都无法让甲损失超过5。因此为了自己的利益,甲应保守点,选择C,若乙也采取相同策略,则最佳选择为E。最后乙费尽心思只拿到5分,这也是他估计最少的得分,而甲却得到估算的最高分5分,这就成为均衡的游戏:个别游戏者的最佳选择,刚好是最好的状况。不论他们事前是否已经知道对手的行动,都不能改变所得结果。
在这里,乙的“最小数极大化”和甲的“最大数极小化”策略结果刚好一致,这是在两人都承认对方的聪明才智时,能做的最好选择。在这样的游戏中,如果对手并非明智之士,但也有例外。因此,乙选择E,甲选择C是很谨慎的做法。毕竟,这是个稳定的游戏。
现在,让我们改变原来的分值顺序,将C列的3和5对调。这时,甲仍沿用先前将最大数极小化的想法,还是选C,期待损失仍为5分;同理,乙将最小数极大化,仍选E,但期待获利变成3。所以两人若用前述方式,这次乙的得分变成3,而不是5。
当乙站在甲的立场思考,发现甲很可能选择C,则他就会改选F;当然,甲可能看穿乙的计谋改选B,使乙落得只得1分的下场。回过头来看,如果甲没看出他的心思,那么他很可能得到5分。
当然乙也可以假设甲认为他可以猜透自己的想法,而决定选B,那么在下一局里,乙可以改选回E,使自己在策略思考上略胜甲一筹。但甲当然也会在随后比赛中追上来,周而复始。在这样的竞赛游戏里,所有信息都清楚呈现在表上,重点就在战术与对策的谋划,谋划力强、能事前推演多种可行方案的人,胜算就比较高。
稍微把规则改一下,马上可以得到一些概念。如果允许甲和乙不只选一行,分开下注,比如可以把一半赌注放在A,另外各押1/4给C和D等等。
还是沿用第一张表,现在再来看看乙在这个不稳定游戏中的策略,他目前的情况是这样的,如果采用“最小数极大化策略”,就应该选E,如果甲也用“最大数极小化策略”,则会选C,结果乙只能得到3分。其实,若乙很肯定甲会选C,他就应该挑F,才能得到5分,那么,干脆两个可能性都下注不是更好吗?
如果他为了防止狡猾的甲得逞,决定把2/3的筹码放在E,另外1/3放在F,这样即使甲真的选了C,乙还是有2/3的赌注赢得3分,1/3得5分。这比原来只能拿到2/3的3分(即2分)要好得多。如果甲想唬他而选B,那么乙就有2/3的赌注得到6分,1/3得到1分,总和更高。这并不是乙的最佳下注法,但也很接近。
在整个过程中,甲当然知道乙可以分开下注,所以自己也用分散赌注的方式降低乙的获利。他可以采取保守但也是最好的策略,把部分赌注放在C,同时也在B下注,以和乙最可能的策略抗衡。其实,甲如果把赌注都下在同一行应有更好的成绩。在这类游戏中,不论稳定与否,对每位游戏者都会有某种最佳策略,或是集中火力,或是分开下注,但两者都会导出最后的稳定状态。不管对手如何下注,每位参赛者都有一个最佳的分散赌注策略使自己的获利最大化。