0 引言 科技评价是构建我国科技发展环境的重要基础。中华人民共和国成立以来,我国科技评价活动日趋复杂多元。评价对象由最初的科技成果逐步扩展为包含项目、计划、人员、机构、科技发展领域和科技规划等在内的科技活动全要素,科技评价工作贯穿了科研活动的全过程。评价目的也从最初的“恢复与重建科技奖励制度和职称制度”到“规范科技评估活动”(国科发计字[2000]588号),再到“优化科技管理决策,加强科技监督问责,提高科技活动实施效果”(国科发政[2016]382号),进而逐步发展为“为提升我国科技创新能力、加快建设创新型国家和世界科技强国提供有力的制度保障”(中办发[2018]37号)。科技评价的重要性日益凸显,但另一方面,科技评价中存在的问题也受到越来越多的关注[1]。 近年来,国家层面不断加大对科技评价中突出问题的整改力度,先后出台了《关于深化项目评审、人才评价、机构评估改革的意见》(中办发[2018]37号)、《关于优化科研管理提升科研绩效若干措施的通知》(国发[2018]25号)、《关于开展清理“唯论文、唯职称、唯学历、唯奖项”专项行动的通知》(国科发政[2018]210号)、《关于进一步弘扬科学家精神加强作风和学风建设的意见》(中办发[2019]35号)等一系列改革政策,旨在破解科技评价中存在的突出问题,回归科技评价的“初心与使命”,建立遵循科技发展规律、促进科技创新发展的评价机制,营造真正激励创新、追求科学真理的科研环境。 科技评价是指由特定主体依据相关准则与规范,对客体所开展的与科技相关的各项活动及成效进行的观测和评判活动。科技评价活动在创新实践中具有重要的导向功能和激励功能,在科技资源配置与科技创新中发挥着“指挥棒”和“风向标”的作用。近年来针对我国科技评价中存在的诸如急功近利[2]、重数量轻质量倾向[3];科学共同体的自治和自律性不足[4];评价制度化保障不足[5]等问题,社会各界展开了积极探讨,但对科技评价政策本身的研究相对不足。 作为引导科技评价活动的纲领文件,科技评价政策本身的科学性与合理性将直接影响评价工作的效果与质量。当前我国的科技评价政策研究主要针对特定主体的评价政策展开。例如,徐芳等[6]将中科院评价分为蓝皮书评价、二元评价、综合质量评估和重大成果产出导向评价四个阶段,指出中科院研究所评价政策总体呈现“以数量评价为主向以质量评价为主、从研究所大排名向分档分类评价、从外评估向自评估与交流评议相结合”的演变趋势。毋改霞等[7]根据关键事件将中国学术评价分为初步发展期、恢复调整期、彷徨变革期和完善挺进期,指出我国学术评价政策呈现“评价标准由单一向分类多元、评价主体从行政主导向多元主体、评价程序从不完善到规范有序”的变迁特征。吴华溢[8]根据关键事件将中国高等教育评价分为党政主导下的单一评价期、市场经济引入期、社会中介评价组织兴起时期和“管办评分离”及多元评价引入期,并分析了不同阶段权力主体的变化。还有学者从政策工具视角对某一类科技评价政策的变迁展开研究。如,谭玉等[9]和薛楚江等[10]学者对国家科技人才评价政策的研究,关志康[11]对中国教育评价政策的研究等。 已有研究主要集中于特定主体或某类评价政策的研究,对国家层面科技评价政策的基本特征、发展变迁与可能存在问题的系统性研究不足。此外,对科技评价政策变迁的研究多是基于评价主体、评价方法和政策工具等政策外部属性的分析,鲜有对政策文本内容的挖掘,对不同时期评价主体的注意力变化分析不足。本文以1978至2020年的国家科技评价政策为研究对象,对其基本特征、政策主题和合作网络进行系统的文本挖掘与分析,较为客观、全面地呈现我国科技评价政策的演化与变迁路径,发现不足与制约,进而从政策输出层面为科技评价活动乃至科技评价体系的优化升级提供支撑。 1 数据来源、分析维度与研究方法 1.1 政策范围与政策收集 在实践中,科技评价、评估、评审、评议等概念被广泛代指科技评价活动。在《科技评估管理暂行办法》和《科学技术评价办法(试行)》中,科技评价/评估被视为“评价与咨询活动”,评价对象逐渐泛化为“科技活动及相关责任主体”。鉴于此,本研究的科技评价将评价、评估、评审、评议和评奖等都包含在内。与之相应,科技评价政策是对科技活动及相关责任主体进行评价、评估、评审、评议和评奖等的政策规定。政策文本来源包括科技部、财政部、教育部等政府网站以及北大法宝法律法规数据库等。 1.2 政策数据库建立 以“评估or评价or评审or评议or评奖or考核or考评”等为关键词在有关网站进行政策检索与下载。然后,根据政策内容删除非相关政策,并对未收录的关联政策进行二次查选。最后,录入政策标题、发文时间和发文部门等信息,再次核准后,建立了拥有484篇政策文本的政策数据库。 1.3 分析维度构建与研究方法 (1)政策内容梳理借鉴扎根理论的编码思想对政策文本内容进行初步梳理。首先,通过逐句编码实现政策文本的抽象化与概念化。其次,根据逐句编码所得概念的语义、功能和因果关系等建立彼此间的联系,提炼主范畴。最后,通过分析不同主范畴间的关系,挖掘能够统领所有主范畴的核心范畴。研究最终获得评价对象、评价方式、评价结果的运用和其他政策内容四个核心范畴(表1)。
(2)编码信度和效度检验为保证编码结果的客观性,内容分析的信度通过编码者之间的一致性程度(CA)进行检验[12]: