“囚徒困境”,其原文为the Prisoner's Dilemma,又译为囚犯的两难困难,囚犯难题等。这是大约在1950年由社会心理学家梅里尔·M·弗勒德(Merril M.Flood)和经济学家梅尔文·德雷希尔(Melvin Dresher)首先提出来的,后来由诺贝尔经济学奖获得者的导师艾伯特·W·塔克(Albert W.Tucker)明确地叙述了这种“困境”。之后纳什有两篇关于非合作博弈的重要文章分别发表于1950年和1951年。塔克的这项工作同纳什的文章一起被认为基本上奠定了现代非合作博弈论的基石。因此,“囚徒困境”的重要性自然不言而喻①。 “囚徒困境”作为博弈论中的一个经典范例,其博弈理论渐渐为经济学、哲学、伦理学和管理学等诸多学科的研究所重视,一些学者把“囚徒困境”之博弈理论视作理解和指导当代经济活动的重要理论依据,更有甚者把它作为企业竞争中必须考量和选择的博弈“圣典”和道德理路。辩证地看待这一研究现象,其基本研究理路无可非议,因为这至少是促进人们深入研究相关社会现象的一种特殊的思维路径和方法。但经济领域近年热衷于“囚徒困境”的博弈理论的研究,似乎唯有“囚徒困境”之博弈理论才能说明经济领域的竞争之态势和竞争之激烈。有人搞经济理论研究言必称“囚徒困境”,甚至认为,经济伦理研究如果不涉及此一理论,就无异于徘徊在真正的学术殿堂大门之外,无法进行真正的、高水平的学术对话。这一现象让人不禁疑惑:果真“囚徒困境”的博弈理论有如此神奇,甚或可以统揽经济理论研究或统领经济活动?果真“囚徒困境”的博弈理论能够厘清当今各种经济利益关系和经济道德关系?实际上,把“囚徒困境”的博弈理论套用于当今经济活动领域,是市场经济条件下极具功利色彩的、信息极不对称的、非合作性的处于“生人圈”之中的经济竞争理论。因此,对其局限性加以揭示,并厘清其适用范围,还“囚徒困境”的博弈理论以本来面目,这不仅无损于我们利用“囚徒困境”的博弈理论来进行经济理论及其相关理论研究,而且可以开辟“囚徒困境”的博弈理论所未涉足的理论“空场”,推进经济理论研究和其他相关理论研究不断走向深入。基于此,本文试从经济伦理的语境对“囚徒困境”进行深度检讨,以期为走出“囚徒困境”的“漩涡”指明路径。 一、“囚徒困境”之德性假设 “囚徒困境”的故事讲的是两个具有犯罪嫌疑的囚犯甲、乙,被警察分别关在了两个隔离的房间中,警察对这两个囚犯进行分别的审讯。在审讯中,警察向他们分别提供了三个选项,并让他们做出选择:第一、若他们中的一个坦白了事实真相,那么坦白的将只判3个月监禁,而没坦白的将被判10年刑;第二、若他们都坦白了,那么他们都将被判5年的刑;第三、若他们都不坦白,那么他们都将判1年的刑。假设充分保障囚犯的决策权,让他们选择对自己最有利的行为方式,结果发现他们都坦白了事实的真相,于是都被判了5年的刑。 很显然,这对两个囚犯来说并不是最佳的选择,于是构成了所谓的“囚徒困境”:即两个囚犯都试图选择对自己最有利的行为方式,结果却发现陷入了对双方不利的境遇。为什么会导致如此的结果呢?这是因为两个囚犯本性是利己的,他们的选择都会把个人利益的最大化作为目标,都会通过严密的逻辑推理去追求一个对己最佳点,即“纳什均衡点”②。 作为囚徒甲,他的推理如下:假如我选择坦白,那么乙要是不坦白,我将只判3个月监禁,即使他坦白,我也只会被判5年刑;假如我选择不坦白,那么乙要是坦白,我将被判10年刑,即使乙不坦白,我还是要判1年刑。因此,我不会去冒被判10年刑的风险而去选择不坦白。也就是说选择坦白对“我”是最佳的。同理,囚徒乙也会做出同样的推理。 由此不难看出,囚徒甲、乙的推理就个人而言是合理的,且是他们各自的最佳选择,这样的选择使两个囚犯陷入了困境。 尽管人们对“囚徒困境”故事耳熟能详,尽管“囚徒困境”故事在经济学等相关学科理论中都被引为经典性的事例,但是,熟知非真知。其实很多人并未意识到“囚徒困境”的理论悬设。如果仔细加以考量的话,不难看出,“囚徒困境”故事是某种虚构的情节,它存在明显的“漏洞”,而这些“漏洞”恰恰是“囚徒困境”的局限性之所在。 造成“囚徒困境”的预设有三:一是每个囚徒必须知道博弈规则及其后果;二是每个囚徒必须是理性的,即总可做出对自己最有利的判断,譬如一个不那么理性的囚徒就很可能径直选择不坦白,这是最重要的;三是囚徒之间必须相互隔离,不可订立攻守同盟,亦无法获悉对方的选择倾向。正如有论者指出,“囚徒的苦恼在于他们不能商量沟通。”③但后来的研究表明,弱化这些预设困境仍然成立。 其实,首先应该讲明的一点是,困境绝不限于“囚徒”,任何谋求对自己有利的理性双方(可用“经济人”或理性人代之)都可能陷入其中,“囚徒”也不限于两个,涉及多方的博弈可能更为复杂一些,但那不过是大规模的“囚徒困境”问题。关于囚徒之间是否订立攻守同盟问题,当然是应该考察的层面,但这并不具有根本性的意义,因为这些协议约束力实际上很难保证,谁也无法保证对方信守诺言而不背信弃义。“因为,这一博弈模型预设博弈者是来自霍布斯世界中的‘豺狼人’,即每个人都是他人财物的可能掠夺者。在这种博弈中,既然人人都无道德感,就无所谓守信、履约和恪守承诺问题。”④概要说来,“囚徒困境”的德性假设主要有三: 其一、其主旨思想是宣传功利主义⑤,一切以可能的结果作为犯罪嫌疑人坦白与否的依据。按理,故事情节应该从法律和道德角度支持和鼓励坦白,然而,故事始终没有涉及该不该坦白的问题,虽然故事表面上是主张犯罪嫌疑人坦白,但其情节构思是想要说明坦白与否是一场博弈,犯罪嫌疑人在博弈中选择了坦白。