【中图分类号】 D80 【文献标识码】 A 【文章编号】 1006-9550(2006)06-0067-08 20世纪五六十年代以后,对数学和经济学领域中博弈论(game theory)的借鉴与运用成为国际关系研究发展的重要手段之一。博弈论不但对国际关系理论产生了广泛而深远的学理影响,还直接促进了诸多实践议题的突破与解决,为国际关系研究简洁化、精确化、模型化和科学化的进程做出了重要贡献。同时也应看到,由于自身的固有缺陷以及国际关系学者对其认识及把握程度等原因,国际关系理论中的博弈论仍然存在着很大的限度。 一 社会科学中的博弈论 博弈论本是一种古老的思维游戏,20世纪以后正式用于科学分析。1928年,数学家诺伊曼(John Von Neumann)创立了二人零和博弈。1944年,诺伊曼与摩根斯滕(Oskar Morgenstern)合著《博弈论与经济行为》一书,开始将博弈论用于经济分析。1950年,数学家纳什(John F.Nash,Jr.)推广最优反应策略,即纳什均衡(Nash equilibrium),将博弈论由零和博弈推进至非零和博弈,使其能更广泛地贴近日常生活分析。① 同一年,托克(A.W.Tucker)界定了“囚徒困境”。他们的著作奠定了现代非合作博弈论的基石,此后,博弈论的研究进一步精炼化、延展化。1965年,泽尔腾(Reinhard Selten)引入动态分析,提出了“精炼纳什均衡”概念。1967年,海萨尼(John C.Harsanyi)将不完全信息引入博弈论的研究,接着,克瑞普斯(D.Kreps)和威尔逊(R.Wilson)又在1982年合作发表了关于动态不完全信息博弈的重要文章。② 这样,在正式的非合作博弈理论中就形成了4种博弈分析模型,分别是完全信息静态博弈(纳什均衡)、完全信息动态博弈(子博弈精炼纳什均衡)、不完全信息静态博弈(贝叶斯纳什均衡)和不完全信息动态博弈(精炼贝叶斯纳什均衡)。③ 20世纪80年代以后,实验博弈和演化博弈进入博弈论,实验博弈论用实验研究策略行为的一般原理,而演化博弈则将达尔文的生物进化论引入博弈论,它假定参与人是有限理性的,与此前假定人是完全理性的古典博弈论形成区别。④ 90年代以后,以质疑传统博弈论共同知识假定为起点,强调参与者的学习和模仿功能对博弈进程影响的博弈学习理论成为博弈论的一个重要发展方向。 博弈论的中心思想是将具有自主利益的行为体设定为理性行为者,假设它们在给定的规则条件下,在预测其他参与者行为的基础上,对自己的行为类型(如合作、背叛等)所获得的结果进行得失比较,进而决定采取何种行动策略。博弈论实质上是关于策略相互作用和理性行为的理论,其3个要素是参与者、策略和支付。⑤ 博弈论有多种类型,根据博弈方式划分,有囚徒困境、斗鸡博弈、猎鹿博弈、调和博弈等博弈模型,⑥ 每一种模型都是理想化的,但又可以运用于特定的现实案例。根据博弈结果,可分为常数和博弈与变量和博弈。根据博弈主体,可分为二人博弈和多人博弈。根据互动性质,可分为合作博弈与非合作博弈,其区别在于博弈者能否达成一个具有约束力的协议,有就是合作博弈,没有就是非合作博弈。在日常运用中,最受关注的是两类博弈:一是博弈模型,应用最多的是囚徒困境、斗鸡博弈、猎鹿博弈;二是博弈的次数或进程,即简单(单轮)博弈与重复博弈。简单博弈假设博弈一次进行,重复博弈不是简单博弈的重复与连续,而是指具有同样结构的博弈重复多次进行,但各个博弈阶段彼此独立,其总体结果影响博弈者的长期收益预期。 二 国际关系博弈论研究的发展历程 在国际关系理论中,现实主义和自由主义对博弈论的运用最为广泛,其所设定的博弈者主要是国家,重点体现在国际安全和国际政治经济学领域,包括实践和理论两个层面。自20世纪50年代至今,国际关系中的博弈论经历了3个主要发展阶段。 (一)20世纪50~70年代以研究冲突为主的阶段 20世纪五六十年代是国际关系研究中博弈论的兴起阶段,学者们广泛使用博弈论来研究国家间在冲突和外交决策中的互动过程,博弈论有时成为理性选择范式的一个组成部分。1957年,卡普兰在其代表作《国际政治的系统与过程》一书中就对各种类型的博弈进行了详细的解释与应用。⑦ 60年代以后,谢林(Thomas C.Schelling)、博尔丁(K.E.Boulding)、拉帕波特(Anatol Rapoport)和多伊奇等成为博弈论的重要代表人物,《冲突解决杂志》(Journal of Conflict Resolution)从这一时期开始成为发表研究冲突的博弈论学术成果的重要阵地。谢林用斗鸡博弈分析了美苏之间包括古巴导弹危机等在内的多项冲突,他认为在斗鸡博弈中,最佳方案是稳站道路中央,而不要连续做出微小退让,这样做会避免双方发生正面冲撞。如果避开大路走边路,拒绝参与博弈的话,就会招致惨重损失。⑧ 在《冲突战略》一书中,谢林重点研究了如何将威胁使用武力作为一种威慑战略来加以使用,论述了威慑在国家互动中的实质、作用及如何使用理性与非理性行为技巧。谢林认为,在核时代,选择战争无疑是最愚蠢的行为,但是向敌对方显示有控制的威胁或战争的危险却是正确的战略措施,人们应该尽量让自己的行为符合理性,但是没有必要在任何情况下都表现得很理性。在此基础上,他发展出博弈论中著名的讨价还价理论,并使用博弈论模型来研究了相互依赖决策问题。⑨ 拉帕波特和查马(Albert M.Chammah)则将囚徒困境模型应用到国际军备裁减问题上,但分析的结果是发现参加军备竞赛的国家无法确定其他国家的长远意图,这样就无法克服囚徒困境,不得不实施背叛战略,即将成本高昂的军备竞赛进行下去才是慎重的选择。⑩