共赢促进合作的认知计算机制：互惠中积极期望与社会奖赏的作用

引用| 收藏 |打印|下载word

作　　者：

吴小燕

作者简介：

吴小燕，付洪宇，张腾飞，北京师范大学认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院（北京 100875）；鲍东琪，苏黎世大学经济学系神经经济学中心（苏黎世 8006 瑞士）；胡捷，华东师范大学心理与认知科学学院上海市心理健康与危机干预重点实验室（上海 200062）；朱睿达，中山大学心理学系（广州 510006）；封春亮，华南师范大学心理学院（广州 510631）；古若雷，中国科学院心理研究所行为科学重点实验室（北京 100101），中国科学院大学心理学系（北京 100049）；刘超（通讯作者），北京师范大学认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院，E-mail：liuchao@bnu.edu.cn（北京 100875）。

原文出处：

心理学报

内容提要：

在社会互动中，人们常表现出有条件的合作行为，即只有在预期他人也合作时人们才愿意合作。当前该过程的认知机制尚不明确。本文采用多回合版本的囚徒困境范式，两项实验均表明个体的合作行为随合作者合作行为的提高而提高。认知计算模型显示个体同时采用了一阶信念(只根据他人过去的行为)与二阶信念(既根据他人过去的行为，也考虑自己的行为对他人产生的影响)去更新他们对合作者的合作概率的期望。结果显示个体的有条件合作行为的提升由积极期望(即合作成功使得个体对合作者建立了积极的期望)与社会奖赏(由合作本身带来的额外奖励)共同驱动。这些结果揭示了有条件的合作行为的计算认知学习机制，阐明了积极期望和社会奖赏对合作的促进作用，能为社会中各领域合作的成功推动提供了重要的科学证据与参考价值。

期刊代号：B4

分类名称：心理学

复印期号：2025 年 01 期

关键词：

条件合作社会奖赏积极期望认知计算建模信念更新　　conditional cooperation social reward positive expectation cognitive computational modeling belief update

字号：大中小

　　1 前言

　　合作(Cooperation)是促进人类社会发展的基石(Fehr & Fischbacher，2003)。合作并非凭空发生，而是依赖于合作中的互惠和收益(Fischbacher et al.，2001)。当个体在合作中付出却没有回报时，其行为无法得到强化，因而合作关系无法持久(Baker & Rachlin，2001)。合作本质上需要参与各方牺牲自我利益，以达到群体最优。因此，人们在面临合作时也期待对方有所付出以实现互惠共利(De Cremer & Van Lange，2001)。大量的研究表明个体通常在他人合作或预期他人会合作的情况下才会愿意合作，这称为有条件的合作(Conditional cooperation，简称条件合作)(Fehr & Schurtenberger，2018)。但至今为止，条件合作的认知计算机制尚不清楚。根据既往研究，有两个重要的因素驱动着个体进行条件合作，分别是合作期望(即个体对他人合作的期望)与社会奖赏(Social reward，即合作成功带来的喜悦与主观积极体验)(Pal & Hilbe，2022)。

　　有效的合作决策需要准确地预知合作者的合作意愿，那么人们如何能够知道他人的合作意愿呢？最重要的信息来源于先前的互动(van Baar et al.，2019)。在多次互动的情景中，个体会对合作者的后续行为建立起一个动态的预期，随着多次互动的反馈继而更新这种预期。简而言之，如果个体对合作者抱有积极的期待，即认为合作者有较大可能选择合作，这种情况下如果个体也选择合作就能够为双方带来更大的收益，因此个体的合作概率也会提高(G

chter，2007)。在公共博弈品游戏①中，研究多次发现个体在游戏重复多个回合后，会逐渐通过合作者的合作水平来调整自己的合作水平(Fischbacher et al.，2001)。这一过程得到了许多研究确认，但直到最近几年才有研究者应用认知计算建模试图揭示合作的动态学习过程。Fareri等人(2012，2015)采用了强化学习的基础模型来研究个体在信任游戏②中的动态学习过程。该模型假定个体根据每次互动的结果与预期的差异(即预期误差，Prediction error)，通过学习率(Learning rate)来更新下一回合的预期(即预期更新，Expectation updating)。这里学习率的大小影响了个体将预期误差用于更新下一回合的预期的速度。该模型的特点是人们只是在被动地根据对手过去的行为建立未来合作可能性的预期。尽管该研究发现了带有学习假设的模型要比没有学习假设的模型更好地解释被试的行为，也为动态预期更新的过程提供了认知机制上的证据(Fareri et al.，2012；Fareri et al.，2015)。但不足之处在于该研究中仅采用了一种学习模型，并未与其他模型比较。

　　心理学认为心智化(Mentalizing)是支持人们社会互动的重要心理功能(Astington & Jenkins，1995)。上述提到的单从他人的行为表现来推导其心理和意图的心理过程被称为“一阶信念”，是人们较为基础的心智化功能(Rusch et al.，2020)。相比于一阶信念，“二阶信念”是更加高级和复杂的心智化功能。二阶信念指的是双方在互动过程中，个体不仅会从合作者的行为表现来推测其合作意愿，也会考虑到自己过去的行为如何影响对方从而影响对手接下来的行为(Wu et al.，2020)。研究发现个体在实时博弈的监工游戏③中同时采用一阶和二阶信念去更新他们对竞争对手行为的预期(Hampton et al.，2008)。该研究中所应用的影响模型(Influence Model)假设个体不仅可以根据对手以往的表现来推断其想法(一阶信念)，还包括个体同时考虑自己的行动如何影响对手的信念从而影响对手接下来的行为(二阶信念)。随后有脑成像研究发现，在监工游戏互动中，个体的一阶信念和二阶信念可能由不同的神经机制所调控(Hill et al.，2017)。尽管二阶信念在社会互动中如此重要，然而在多次合作情景中的作用尚不明确。合作相关的实验范式与上述研究中监工游戏范式的不同点在于，合作范式中存在合作双方最优解，即每个人放弃自己的最优选择可以成就双方总和最优解。那么个体在多次合作情景中是否也采用了二阶信念去推测合作者的行为呢？目前尚未有研究考察。这可能是用于研究合作行为的经典范式囚徒困境有稳定的纳什均衡点④(Kreps et al.，1982)。当双方决策达到纳什均衡点时将不再有信息更新，此时个体无需通过预期误差去更新对合作者的期望，因此也不适用于探索其行为决策的动态发展过程。因而，本研究的目的之一是构建一个能够观察到个体在动态学习中不断调整合作行为的实验环境，以便我们采用计算建模探索人们在合作过程中的动态预期更新，并深入揭示合作的计算认知机制。为了更加深入探究合作过程中个体对他人预期的动态学习过程，本研究将比较不同的模型，以探索个体是否在多次合作中同时采用一阶和二阶信念去更新他们对合作者的合作意愿的期望。

　　社会互动会带来愉悦的体验，这种体验被称为社会奖赏，在促进个体参与社会行为方面起到重要的作用(Tamir & Hughes，2018)。促成条件合作的另一个可能因素是社会奖赏(Stallen et al.，2013)，即合作成功本身能够带来奖赏价值，从而强化人们的合作行为(唐辉等，2022)。脑成像研究表明，在获得相同金钱奖励的条件下，双方合作会引发腹侧与背侧纹状体更强烈的激活。腹侧与背侧纹状体是奖赏加工的重要大脑区域，这表明人们在合作中获得收益会产生更强的奖赏反应(Rilling et al.，2002)。事件相关电位研究也报告了类似的发现(白丽英等，2014)。Rilling等人(2002)认为这种由合作成功所带来的社会奖赏对于维持合作非常重要。但是如果在互动中个体能够精确预测合作者的行为，这已经有足够的信息能够帮助个体做出决策(Nowak & Sigmund，1993)。那么还需要额外的社会奖赏来促进条件合作吗？对于这个问题我们尚未知道答案。目前尚未有研究采用认知计算建模系统地检验这两者在多次合作中的作用。因此，本研究的另一个目的是通过系统地构建和比较不同的认知模型，探索人们在多次合作过程中条件合作行为产生的认知计算机制，检验合作期望和社会奖赏这两者对条件合作行为的作用。

共22条结果上一页12 3 4 5 6 下一页全部展开

从累加到类型视角：儿童期逆境对个体神经生...

谢明珺

心理学2025年第01期
基于眼动信号来源的认知老化差异性

黄景

心理学2025年第01期
社交焦虑调节社会评价预期的形成过程：基于...

张逸飞

心理学2025年第01期
中国社会陌生人之间合作行为的变迁：基于社...

苑明亮

心理学2025年第01期
“二孩家庭”的父母协同教养及其影响因素

刘畅

心理学2025年第01期

共赢促进合作的认知计算机制：互惠中积极期望与社会奖赏的作用

相关文章：