在社会互动中,人们常表现出有条件的合作行为,即只有在预期他人也合作时人们才愿意合作。当前该过程的认知机制尚不明确。本文采用多回合版本的囚徒困境范式,两项实验均表明个体的合作行为随合作者合作行为的提高而提高。认知计算模型显示个体同时采用了一阶信念(只根据他人过去的行为)与二阶信念(既根据他人过去的行为,也考虑自己的行为对他人产生的影响)去更新他们对合作者的合作概率的期望。结果显示个体的有条件合作行为的提升由积极期望(即合作成功使得个体对合作者建立了积极的期望)与社会奖赏(由合作本身带来的额外奖励)共同驱动。这些结果揭示了有条件的合作行为的计算认知学习机制,阐明了积极期望和社会奖赏对合作的促进作用,能为社会中各领域合作的成功推动提供了重要的科学证据与参考价值。
chter,2007)。在公共博弈品游戏①中,研究多次发现个体在游戏重复多个回合后,会逐渐通过合作者的合作水平来调整自己的合作水平(Fischbacher et al.,2001)。这一过程得到了许多研究确认,但直到最近几年才有研究者应用认知计算建模试图揭示合作的动态学习过程。Fareri等人(2012,2015)采用了强化学习的基础模型来研究个体在信任游戏②中的动态学习过程。该模型假定个体根据每次互动的结果与预期的差异(即预期误差,Prediction error),通过学习率(Learning rate)来更新下一回合的预期(即预期更新,Expectation updating)。这里学习率的大小影响了个体将预期误差用于更新下一回合的预期的速度。该模型的特点是人们只是在被动地根据对手过去的行为建立未来合作可能性的预期。尽管该研究发现了带有学习假设的模型要比没有学习假设的模型更好地解释被试的行为,也为动态预期更新的过程提供了认知机制上的证据(Fareri et al.,2012;Fareri et al.,2015)。但不足之处在于该研究中仅采用了一种学习模型,并未与其他模型比较。 心理学认为心智化(Mentalizing)是支持人们社会互动的重要心理功能(Astington & Jenkins,1995)。上述提到的单从他人的行为表现来推导其心理和意图的心理过程被称为“一阶信念”,是人们较为基础的心智化功能(Rusch et al.,2020)。相比于一阶信念,“二阶信念”是更加高级和复杂的心智化功能。二阶信念指的是双方在互动过程中,个体不仅会从合作者的行为表现来推测其合作意愿,也会考虑到自己过去的行为如何影响对方从而影响对手接下来的行为(Wu et al.,2020)。研究发现个体在实时博弈的监工游戏③中同时采用一阶和二阶信念去更新他们对竞争对手行为的预期(Hampton et al.,2008)。该研究中所应用的影响模型(Influence Model)假设个体不仅可以根据对手以往的表现来推断其想法(一阶信念),还包括个体同时考虑自己的行动如何影响对手的信念从而影响对手接下来的行为(二阶信念)。随后有脑成像研究发现,在监工游戏互动中,个体的一阶信念和二阶信念可能由不同的神经机制所调控(Hill et al.,2017)。尽管二阶信念在社会互动中如此重要,然而在多次合作情景中的作用尚不明确。合作相关的实验范式与上述研究中监工游戏范式的不同点在于,合作范式中存在合作双方最优解,即每个人放弃自己的最优选择可以成就双方总和最优解。那么个体在多次合作情景中是否也采用了二阶信念去推测合作者的行为呢?目前尚未有研究考察。这可能是用于研究合作行为的经典范式囚徒困境有稳定的纳什均衡点④(Kreps et al.,1982)。当双方决策达到纳什均衡点时将不再有信息更新,此时个体无需通过预期误差去更新对合作者的期望,因此也不适用于探索其行为决策的动态发展过程。因而,本研究的目的之一是构建一个能够观察到个体在动态学习中不断调整合作行为的实验环境,以便我们采用计算建模探索人们在合作过程中的动态预期更新,并深入揭示合作的计算认知机制。为了更加深入探究合作过程中个体对他人预期的动态学习过程,本研究将比较不同的模型,以探索个体是否在多次合作中同时采用一阶和二阶信念去更新他们对合作者的合作意愿的期望。 社会互动会带来愉悦的体验,这种体验被称为社会奖赏,在促进个体参与社会行为方面起到重要的作用(Tamir & Hughes,2018)。促成条件合作的另一个可能因素是社会奖赏(Stallen et al.,2013),即合作成功本身能够带来奖赏价值,从而强化人们的合作行为(唐辉等,2022)。脑成像研究表明,在获得相同金钱奖励的条件下,双方合作会引发腹侧与背侧纹状体更强烈的激活。腹侧与背侧纹状体是奖赏加工的重要大脑区域,这表明人们在合作中获得收益会产生更强的奖赏反应(Rilling et al.,2002)。事件相关电位研究也报告了类似的发现(白丽英等,2014)。Rilling等人(2002)认为这种由合作成功所带来的社会奖赏对于维持合作非常重要。但是如果在互动中个体能够精确预测合作者的行为,这已经有足够的信息能够帮助个体做出决策(Nowak & Sigmund,1993)。那么还需要额外的社会奖赏来促进条件合作吗?对于这个问题我们尚未知道答案。目前尚未有研究采用认知计算建模系统地检验这两者在多次合作中的作用。因此,本研究的另一个目的是通过系统地构建和比较不同的认知模型,探索人们在多次合作过程中条件合作行为产生的认知计算机制,检验合作期望和社会奖赏这两者对条件合作行为的作用。