[中图分类号]I207.23 [文献标识码]A [文章编号]1000-7326(2010)06-0127-09 关于20世纪词学研究的发展历程,近年已有不少论著予以回顾和总结,但都是定性的分析和模糊的把握。如果我们要问:20世纪百年间究竟产生了多少项词学研究成果?在不同的年代成果量有何不同的变化?这些变化有何规律?是何原因?这些问题,迄今没有答案,似乎也无人关注。因为对于学术史的研究,多年来人们只习惯于定性的考察、感性的分析,而不注意用统计的方法去定量分析学术史的进程及其变化。计量学术史,还没有引起注意,本文算是计量学术史的首次尝试。 我们历时十年,全面盘点了20世纪词学研究的家底,搜罗了1901-2000年海内外词学研究论著的所有目录。在时贤相关成果的基础上,经过数十次的增订补充,我们最终搜集到了20世纪词学研究论著目录22909项(一本著作、一篇论文、一部词选等均作1项统计),并研制成《20世纪词学研究论著总目检索系统》。有了这个数据库,我们就可以用准确具体的统计数据来回答上述问题,并可以发现隐藏在数据背后的别样意蕴。 一、20世纪词学研究成果量的增长规律 在计量文献学和计量信息学领域,衡量科学文献的增长,一般有两种方法:一种是以每年新出版文献的数量为依据,一种是以每年出版文献的累积总量为依据。在研究文献增长的规律时,一般采取后者,因为“各年出版的文献逐年相加而得到的文献累积数量总是增加的,就有可能趋于某种固定的规律,所得到的结果,往往是较为规则的曲线,都能用一个较为准确的函数来描述”,而前者,即每一年所出版的文献数量,“容易受到各种复杂的社会因素的影响,一般来说总是波动的,结果往往是一些非规则的曲线,难以用某种函数来描述”,不利于规律的研究。但是,前者“能直观形象地反映出每年新文献的变化趋势”,[1](P45)所以也不失为一种有效的研究方法。
为了从不同的角度统计考察20世纪词学研究成果量的增长变化,我们将20世纪词学研究每年的成果量和累积成果量制成一份总表,见表1。 我们先看20世纪词学研究成果累积总量所反映出的增长规律。科学文献增长的重要规律之一,是美国著名的文献计量学家普赖斯提出的“指数增长规律”,即“任何正常的日益增长的科学领域内的文献是按指数增加的”。[2](P293)20世纪词学研究的成果累积量,也基本上是按指数规律增长的。将表1的20世纪词学研究成果累积量输入计算机后,Excell电子表格可以自动计算出其增长指数,并描述出指数增长的曲线,见图1。
图1 20世纪词学研究成果累积量的指数增长曲线
图2 20世纪词学研究成果年产量变化图 图1是以5年为一个时段来统计,纵坐标为累积成果量,横坐标为年份。表中的粗线,是计算机根据20世纪词学研究成果累积量实际增长的指数而自动生成的曲线,即实际增长曲线。表中的细线,则是计算机根据20世纪词学研究成果累积量反映的指数增长关系模拟出来的趋势曲线,即预期增长曲线。两条曲线的吻合(重合)度愈高,表明实际增长的指数关系与预期增长的指数关系愈加一致。图中的数值R[2],就是表示两条曲线的相关性、吻合度的,其范围是0-1,数值越接近1,表明相关性、吻合度越高。而图1中R[2]=0.9252,这个数值表明,实际增长的指数曲线与预期增长的指数曲线之间的吻合度、相关度非常高,换言之,20世纪词学研究的成果增长量非常符合指数增长曲线。这也表明,20世纪词学研究成果量的增长,与其他科学文献的增长趋势相似,符合科学文献增长的一般规律。 从图1可以看出,1930年代以后生成的粗线在模拟细线之上,说明1930年代的成果量有较大幅度的增长,超过了常规增长态势。而1980年代增长速度迅猛,1990年代中后期增长速度放慢。且看下面这组数据: 第一个5000项,用了77年的时间:1901-1977年; 第二个5000项,用了8年的时间:1978-1985年; 第三个5000项,用了6年的时间:1986-1991年; 第四个5000项,用了6年的时间:1992-1997年。 1978-1985年8年词学研究的成果量相当于此前77年成果量的总和,可见其增长速度之快。而第三个5000项与第四个5000项所用时间相同,表明1986年以后词学研究成果的增量达到了相当高的水平之后,年度增幅放慢,每年的年产量是平稳中有升有降。 再从单年的产量来看。表1显示,一百年间词学研究成果的年产量极不平衡。1903-1904年的成果量为0,除去这2年,词学研究成果年产量最低的是1912年,全年仅有1项研究成果;最高的是1986年,达到964项,这一年的成果量比1901-1935年35年间的成果总量还多。