中国在科学技术特别是在一些前沿学科领域的迅速崛起已成为不争的事实(Zhou和Leydesdorff,2007;Adams,King和Ma,2009)。汤森路透Web of Science(WoS)数据显示,中国的科研产出近年来增长迅速。2005年,中国科研发表排名仅为第五,位列美、英、德、日之后(OECD,2007)。到2010年,中国已位列第二,紧随美国其后(Moiwo和Tao,2013;Zhang,Patton和Kenney,2013)。在国际发表引用率方面,《中国国家中长期科技发展规划》中提出的科学论文引用次数到2020年上升至世界前五的目标,已经在2012年提前实现(Bound,Saunders,Wilsdon和Adams,2013)。随着中国科研发表质量和影响力日益提升,中国的标准化引用虽然就整体而言仍低于美国和其他领先国家,但某些领域已经达到或接近世界科研影响力的平均水平。 分学科来看,中国科研被引频次在数学和农业领域相对较高,而在计算机、空间科学、生物化学、材料等领域过去十年则呈现强劲增长(Bound等,2013;Moiwo和Tao,2013)。在WoS收录的纳米科技论文中,2010年中国在数量上已位列全球第一(Zhou和Leydesdorff,2007;Tang和Shapira,2011a;Kostoff等,2012)。中国在纳米技术领域的高被引——亦称“重量级”论文——的数量在不断增加(Kostoff,2012)。论文被引频次与世界其他领先国家的差距也在缩小(Youtie,Shapira和Porter,2008;Hu和Rousseau,2013)。 那么是什么原因推动了中国论文被引频次的增加?以往研究提出下述解释:1)中国研究本身的质量随着时间的推移不断提升,从而使得更好的论文得以发表在具有更高影响因子的期刊上,进而得到更多的引用(Guan和Ma,2007;Appelbaum,Parker和Cao,2011);2)中国数量庞大的科学家之间的激烈竞争推动了研究进步(Suttmeier,Cao和Simon2006);3)海外华人在中国国际合作研究中扮演了重要角色。中国的知识中介者,通过与中美双方科研人员的持续深入合作,提高了中国的科研质量(Jin,Rousseau,Suttmeier和Cao,2007;Tang 2013);4)随着中国英文发表文章的增多,以及汤森路透Web of Science数据库中所收录的中国期刊的增多,中国科研成果在国际学术舞台上的可见度有了提高(Ren和Rousseau,2002;Lin和Zhang,2007;Huang,Notten和Rasters,2011);5)中国论文发表集中在物理学,生物科学和跨学科研究上,而这些领域由于自身学科特征更常被引用(Shapira和Wang,2010);6)中国科研成果引用的迅速提升,得益于中国在各个层面特别是国际层面合作网络的迅速拓展(Adams等,2009;Costas,van Leeuwen和Bordons,2010)。 在这篇文章中,我们提出另一种可能性:与其他国家的同行相比,中国科研人员的研究更有可能被内部网络引用。以纳米技术为例,我们试图检验中国科研成果的被引频次增长是否存在“互引俱乐部”效应。文章的结构安排如下:我们首先简要回顾引文分析中的有关自引和“俱乐部效应”的研究;接下来是关于本文数据来源和研究方法的描述;然后我们以中美高被引纳米科技论文为例,探析影响被引频次的因素,并运用回归模型来检验“俱乐部效应”的国家差异性。在文章最后,我们对分析的结果进行尝试性解释,讨论该研究结果的局限性与相关政策意义。 二、研究背景 (一)引文中的“俱乐部效应” “俱乐部效应”这一概念最初出现在关于精英科学家大量引用对方成果的研究中(Opsahl,Colizza,Panzarasa和Ramasco,2008),广义上也被用于描述主流科研人员及社群之间互相引用的现象(Colizza等,2008)。在本文中,我们着眼于中国高被引论文被引的“俱乐部效应”,并将其与美国同行作比较,检测“俱乐部互引”是否存在国别差异。在具体测度之前,我们先回顾一下对自引影响的相关讨论。 (二)引用和自引 科技评价领域一般认同被引频次能够基本反映该研究的质量或者更严谨地说反映该研究的知名度或学术影响(Garfield,1979;Redner,1998)。以往的引文分析常把自引——作者引用自己的研究(Noyons,Moed和Luwel,1999;Moed,2002)——作为分析其国际学术影响力的噪音。这一点在文献计量学界有着广泛讨论。一些学者认为自引频次显著影响了文章的被引结果,呼吁在测量影响因子时应剔除自引。Van Raan(1998)的研究发现合作论文,特别是国际合作科研论文的自引比例更高。Hall,Jaffe和Trajtenberg(2001)的研究进一步指出,由于引文本身的延续性和被引频次计算的截断性,新发表文章的自引比例更大。 也有学者持不同见解。如Gl
nzel、Meyer等认为在宏观层面上或当论文样本足够大时,没有必要剔除自引(Pichappan和Sarasvady,2002;Gl
nzel和Meyer,2003;Gl
nzel和Thijs,2004a)。Bonzi和Snyder(1991)的一项问卷调查显示,科研人员引用自己论文或他人论文的动机不存在显著差异。Persson,Gl
nzel和Danell(2004)认为,合作论文的自引率对引用膨胀现象的影响递减。基于1991年至1999年自引数据的分析,他们发现,不仅自引的绝对数量增加幅度小于他引,其占所有被引次数的相对份额也随着时间的推移略有下降。Rehn和Kronman(2008)解释说,这种下降可能是因为学者还是主要根据论文的质量决定是否引用。二人在文章中还进一步推测美国学者的自引高于国际平均水平。Gedik(2012)综合以上两种对于自引的不同观点提出,当使用被引频次来测量知识溢出和内化时,是否要剔除自引值得商榷。如果在引文分析中包括自引,可能会高估知识溢出的影响;反之剔除自引,知识溢出则会被低估。