0 引言 早在2002年的联合国可持续发展首脑峰会,基于“可持续生产与消费”思想,会议提出了可持续公共采购的概念,即要求政府采购行为在实现“物有所值”基本经济功能的同时,充分发挥引导环保与社会责任履行的可持续政策功能[1]。可持续产品,即提供环境、社会和经济效益同时在整个生命周期内保护公众健康和环境的产品,开始成为了一种新的社会风向。作为负责任的大国之一,我国正积极推进公共部门可持续产品的采购实践,2008至2018年期间,全国环境标志产品政府采购总规模已达11452.4亿元,占据政府采购同类产品比重持续增加。同时,国务院发布《关于加快建立健全绿色低碳循环发展经济体系的指导意见》(国发[2021]4号)明确指出要加大政府绿色采购力度,扩大绿色产品采购范围。然而,伴随着可持续产品采购规模地扩大,可持续产品供应的“暗箱”操作更加频繁,可持续标志制度不完善、产品标准缺失、产品证书虚假等问题更为凸显[2],可持续产品的寻租腐败行为给政府和社会带来负面影响。尽管我国在政策制度上对可持续产品的采购目标、边界及原则进行界定,但是“逾越红线”问题依然存在,采购人员与供应商合谋寻租的“可持续腐败”问题仍然困扰公共部门采购链的合理化运作[1]。事实上,这些投机现象无不与自发的市场机制运行相关,与复杂的采购委托代理链和机会主义有关,依靠市场难以有效解决,必须由政府介入。然而,监管部门同样也是“理性经济人”,在行使稽查策略前会权衡其监管成本与收益,过多的监管往往需要耗费大量的资源成本,而监管不足则容易使寻租者谋取寻租机会[3,4]。是否要主动监管?如何监管?依然是置于政府监管部门面前的棘手问题之一。现有研究探讨了可持续公共采购中寻租腐败产生的原因、危害以及监管必要性[1,4,5],但是较少从数理层面研究寻租与监管的作用机理,对于可持续公共采购中的决策行为研究更为欠缺。鉴于此,本文试图分析监管部门、采购人员和供应商在可持续公共采购中发生寻租与监管行为的动态演化机理。通过构建非对称的三方动态演化博弈系统模型,讨论各利益主体互相抗衡的行为,并对其进行稳定性控制,寻求最终获得稳定的演化策略,以期为公共部门的采购和决策提供理论参考,优化可持续公共采购的程序及监管机制。 1 可持续公共采购中寻租监管的演化博弈模型 1.1 模型假设与问题描述 考虑某公共部门委托专职采购机关向指定供应商采购一批可持续产品。在这一采购程序中,现实存在监管部门、采购人员和供应商三个决策主体。其中,采购人员是承接采购任务、实施采购行为的实际决策者,其行为决策空间为(不寻租,寻租,简记为B,NB);供应商作为上游主体,定向于采购人员提供委托机构所需产品,其行为决策空间为(供应可持续产品,供应替代产品,简记为S,NS)。假定供应商与采购人员之间除了正常的交易往来外,出于利益最大化,还存在寻租可能,即双方利用政府监管的机会主义达成合谋寻租,由供应商提供不符合公共机构可持续采购清单(标准)的替代产品供采购人员购买,并以租金作为交易条件。监管部门是独立于买卖双方的第三方监督机构,对采购人员和供应商的交易行为进行监管稽查,其行为决策空间为(监管,不监管,简记为G,NG)。为突显研究重点和降低问题的复杂性,给出假设: 假设1 供应商的客户群体定向为公共机构,假设一旦公共机构不采购,供应商的收益为0[6]。供应商提供可持续产品的总成本为c[,1],被采购后的收益为r[,1];提供非可持续的替代产品成本为r[,2],收益为c[,2]。其中,c[,1]和c[,2]为包含供应商从生产(或经销)该产品到提供给采购人的过程中所可能发生的全部成本费用。由于生产或销售可持续产品往往需要产生更多的技术和管理成本,故c[,1]>c[,2]。可见,供应商“以次充好”谋取高利润的额外收益为Δ[,g]=(r[,2]-c[,2])-(r[,1]-c[,1])>0。 假设2 采购人员做出“寻租”决策之前已经知道供应商所提供的产品是否符合要求。倘若双方合谋寻租,供应商将从其所谋额外收益Δ[,g]中提供一部分租金h给采购人员。采购人员存在基准效益r[,3],同时通过廉政教育和采购监管制度约束,他们将产生一定的心理认知[7],一旦违规决策,即发生寻租腐败或“懒政”行为,自身将产生负的心理预期c[,3]。 假设3 监管部门实施稽查行动会产生来自人、财、物等资源方面的成本耗费c[,4],政府基准收益为r[,4],Δr[,4]为采购双方的合法交易促使政府部门社会形象的提升额度。但是,如果采购人员寻租而导致不合格的供应商获得准入,所造成的社会影响会使政府形象受损c[,5]。再者,如果采供一方的寻租行为被揭发,尽管交易没有产生,但是仍然会导致政府推行可持续采购的形象下跌c[,6],通常,c[,6]≤c[,5]。 假设4 监管部门一旦进行稽查,则采购人员或供应商的不廉洁行为一定会被查到。激励—惩罚机制已被证明可以促使监管客体改变其行为决策[8,9]。采购人员寻租行为被发现,将面临惩罚成本f[,1]。但是,如果保持廉洁采购作风,阻止不符合可持续标准的产品准入,将获得政府的奖励s[,1]。同样,监管部门会对供应商的合法行为进行补贴s[,2],但对其不廉洁的寻租进行严厉惩罚f[,2]。 假定以上参数皆为正值,以便下文讨论。三方博弈收益矩阵,见表1。 1.2 演化过程的均衡点 假设监管部门选择“监管”策略的比例为x,则选择“不监管”策略的比例为1-x,x∈[0,1];类似地,假设采购人员选择“不寻租”策略的比例为y,则选择“寻租”策略的比例为1-y,y∈[0,1];供应商采取“提供可持续产品”策略的比例为z,则选择“提供替代产品”策略的比例为1-z,z∈[0,1]。复制动态分析反映了某一策略在群体演化中的适应程度[10],假设U[,G]和U[,NG]分别代表政府实施监管与不监管策略的适应度,U[,B]和U[,NB]表示采购人员选择不寻租和寻租行为策略的适应度,U[,S]和U[,NS]代表供应商提供可持续产品与提供替代产品策略的适应度,同时用U[,1],U[,2],U[,3]分别表示政府、采购人员和供应商的平均适应度。监管部门在某一时刻t采取监管的概率为x,则在后一时刻监管率的变动与当前时刻的监管概率及各策略的适应度、平均适应度相关,即监管变动率为dx/dt,将其记为F[,1](x,y,z)。