0 引言 为促进科技与经济社会发展更加紧密结合,加快推动科技成果转化为现实生产力,国务院于2021年出台《国务院办公厅关于完善科技成果评价机制的指导意见》[1],并在其中提出创新科技成果评价工具和模式的重要意见,强调充分利用大数据、人工智能等技术手段,开发信息化评价工具。作为一项综合性信息活动,学术成果评价工作的开展依赖于前期评价信息的全面整合,而学术知识图谱在各学科领域学术资源组织场景中的优秀表现也为成果评价辅助工具的开发提供了新的思路。 基于此,本研究在全评价体系框架的指导下将学术成果评价工作细分为形式评价、内容评价及效用评价3类具体场景,通过梳理不同评价场景下我国学术成果评价研究现状,明晰当前我国学术成果评价工作的信息组织需求。在成果类型多样化、分析内容语义化及价值维度多元化的场景需求指导下,本研究分别从图谱内容、实现技术及现实应用3个层面提出面向我国学术成果评价工作的学术知识图谱内容框架、技术框架及构建策略,以期全面推进现代信息组织技术在学术评价场景中的创新应用,同时为我国多元化学术成果评价工作提供全面资源保障。 1 相关研究 1.1 全评价视域下学术成果评价相关研究 在充分借鉴以往自然科学评价理论成果和实践经验的基础上,学者叶继元于2010年面向我国人文社会科学评价问题提出了全评价体系[2],之后该体系广泛应用于不同类型对象的评价工作中,如期刊[3]、自媒体[4-5]、开放数据[6-7]、图书著作[8]及电子资源[9]。作为全方面、多维度、综合性的评价框架,全评价体系通过多项研究中的实证分析进一步验证了该理论体系的科学性和可行性,是本研究全面探寻学术成果评价信息组织需求的重要理论基础。 当前科研人员及机构的学术评价工作大多以其所发表的学术成果作为重要评价依据,故全面真实的学术成果评价结论对于认知其他类型学术主体的价值及影响力具有重要作用。全评价视域下,国内学术成果评价方法相关研究可以划分为形式评价、内容评价和效用评价3个方面:①形式评价。形式评价方面的相关研究主要关注于面向学术成果的内容内含知识及外部著录特征的量化评价,是实现精细化学术成果评价工作的重要部分。为了全面客观认知学术成果的真实价值,我国学者近年来尝试从宏观层面兼顾科研成果的内容质量与实际影响,提出更加系统化的成果评价指标体系或方案,如何春建基于评价指标设计原理,在多维度视角下提出面向单篇学术文献的影响力评价指标体系[10];姜春林等在其研究中关注到学术论著在学术评价方面的重要作用,综合利用专家调查法、熵权法在内的多种方法提出面向人文社科著作评价工作的评价指标体系[11];高锡荣等利用社会网络分析方法进一步精炼论文评价指标,并对其进行标准化处理形成评价指标体系[12]。②内容评价。内容评价方面的相关研究则集中于针对学术成果内容知识价值的评估,通过从语义内容层面细化评价粒度或从引用行为层面丰富评价指标,实现对于成果内容价值的真实反映。如魏绪秋等将引证意图作为学术论文创新性评价参考依据[15];曹树金等通过利用LDA主题模型和SVM分类模型对论文摘要进行分析识别论文的创新性[14];闫晓慧等在综合考虑载体影响因子在内多项因素的基础上提出用于测度学术论文创新度的评价模型[15];陈玥彤等以文献内容差异性的评估为研究视角,提出了面向内容差异的论文评价方法[16];毕崇武等进一步细化内容评价粒度,提出了面向文献知识单元的评价方案[17]。③效用评价。效用评价方面的相关研究则侧重于对学术成果不同维度影响力的测度,当前国内学者在学术成果效用评价方面的研究主要围绕丰富学术成果类型和拓展影响分析维度两个方向展开。前者相关研究在现有以期刊文献为主要评价对象的基础上,补充了面向学术图书[18-20]、专利[21-23]在内多类型学术成果的效用评价方案,后者则主要通过充分利用网络公开数据全面评估学术成果在不同维度下所呈现的价值及效益,例如学术论文的学术影响力[24-26]及社会影响力[27-30]。 1.2 学术知识图谱相关研究 谷歌公司于2012年首次提出知识图谱(Knowledge Graph)的概念,其本质是以图的形式对目标数据进行描述[31]。鉴于知识图谱开放性和互联性的优势,其被广泛应用于不同领域资源组织的研究中。与涵盖多领域的通用知识图谱相比,仅面向特定领域的领域知识图谱在实际应用场景中往往具有更好的表现力,如数字人文领域[32-33]、医学领域[34-35]、金融领域[36-37]等。 作为领域知识图谱的类型之一,学术知识图谱的构建和应用工作近年来也受到国内外不同领域学者的广泛关注。应用层面,王宏宇等在充分调研前沿预测工作需求的基础上提出了基于大规模开放学术图谱的研究前沿分析框架[38];Huang等提出了可以从特定领域文献中实现知识挖掘自动化的系统AKMiner(Academic Knowledge Miner)[39];张云中等提出了面向知识问答场景的图情领域学术知识图谱构建方案[40];卢恒等在充分利用知识图谱技术优势的基础上提出了实现网络社区学术资源深度聚合的方法和理论,并设计出相应的多项应用模式[41];此外,学术知识图谱还被应用于论文推荐[42-43]、创新性识别[44-46]、学术社区识别[47]等场景中;构建层面,Jaradeh等提出了以机器可操作形式实现学术知识获取的方案,为后续知识图谱的构建工作奠定数据基础[48];同时该研究团队还关注到文献中的图表类型数据,利用知识图谱实现了文献表格内容的存储并构建学术问答系统[49];陈翀等提出了以科研人员学术专长为核心的细粒度描述方案,并将其应用于指导知识图谱的构建工作中[50];张颖怡等聚焦于学术论文中的“问题-方法”识别和抽取工作,并提出将其应用于知识图谱构建工作的期望[51];Oelen等提出了一种众包执行的方式来实现学术知识提取的方法TinyGenius,用于适应指数增长的科学文献数量[52];Santini等面向论文作者姓名实体消歧这一问题提出了有效的技术框架,并通过实证分析验证了该框架的良好表现力[53]。 1.3 研究述评 通过对国内现有学术成果评价相关研究的梳理,可以发现近年来我国学者围绕学术成果评价方法已经展开了不同程度的探索,其整体呈现成果类型多样化、分析内容语义化和价值维度多元化的重要趋势。同时,近年来学术知识图谱被广泛应用于不同类型的学术资源组织和知识发现场景中,并在实际案例中被证实拥有良好的语义组织能力。以成果数据为主要驱动力的图谱构建方案尽管可以实现海量学术资源数据抽取效率的提升,但图谱在现实应用过程中也会因为应用场景不够明确导致应用效率不高的问题。本研究拟从当前以学术成果数据驱动的学术知识图谱构建模式转向以面向具体应用场景为导向的构建模式,在整合现有研究贡献的基础上提出更具针对性的以应用场景为导向的图谱构建方案,以期在拓展学术知识图谱应用场景的同时提升学术知识图谱的利用效率。