就现代汉语而言,什么是“词”一直是一个没有解决的问题。“词”和小于“词”的“语素”的界限,“词”和大于“词”的“短语”的界限,在很多场合是谁也说不清楚的。对什么是“词”的问题,陆志韦(1957)、霍凯特(1958)、赵元任(1968)和吕叔湘(1979)进行了几乎是穷尽的讨论,但是也并没有能够得出一个便于操作的说一不二的结论。不过,经过他们这一番深入细致的分析和讨论,问题的关键似乎慢慢明确起来了。不得不承认,在现代汉语里,“字”或者说“语素”是一种“天然”的单位,也就是说是一种容易分辨和确认的单位,而“词”却不是一种“天然”的单位,不是一种客观上有一定的形式标志,因而普通人和语言学家都能容易地分辨和确认的单位。那么,是不是可以说,“词”就完全是一个外来的概念,汉语完全可以不予理睬呢?是不是可以说,我们今天花这么大的力气,这么多的精力来讨论“什么是‘词’?”或“‘词’是什么?”完全是“天下本无事,庸人自扰之”呢?我们认为那也不能这么说。至少是在今天的现代汉语里,像“过去”“现在”“自己”“经济”“反动”“自来水”“巧克力”等等这样一些双音节和三音节的“字组”或“语素组合”,恐怕普通人也好,语言学家也好,是不会一个字一个字拆开来辨认,然后再合起来理解和使用的,而是作为比“字”大、比可以自由组合的“短语”小的一个完整的单位来理解和使用的。这样看来,比“语素”或“字”大、比“短语”小的“词”,或者说“词语”这样的语言单位还是客观存在的,至于给这样的单位取个什么名称倒是无关紧要的。汉语的双音节化或多音节化是多数语言学家承认的,那么就应该承认现代汉语还有比自由组合的“短语”小而不是单音节的“语素”或“字”的单位。问题是汉语的双音节化和多音节化是一个历史过程,即使在今天,在日常口语中单音节单位的使用频率还是比双音节、多音节单位的使用频率高,而且双音节和多音节单位的凝固程度还不那么高,而且凝固程度还各有等差,再加几千年来的中国知识分子只讲“字”,从来不讲什么“词”,因此,这种单位在多数“识字”的人的头脑里面还不那么明晰和确定。这就是为什么我们既不能不承认“词”在汉语中的客观存在,可是又一时说不清楚“什么是‘词’”或“‘词’是什么”的原因。其实,客观世界的事物或现象都是一种连续体,切分为离散的单位始终包含不同程度的主观因素。就形态丰富的语言来说,因为形态就是“词”和“词”之间的边界标志,所以对使用这些语言的人来说,“词”是一种“天然单位”,尽管要从理论上来给“词”下定义也不十分容易,但是实际上分词却并不困难,可以说不成什么问题。但是就非形态语言或是形态不那么丰富的语言而言,要探讨什么是“词”,要分词,都有不同程度的困难。像英语那样形态已经不那么丰富,但是还保留不少形态的语言,什么是“词”的问题也是很难说清楚的。 迄今为止,探讨非形态语言或形态不那么丰富的语言中“什么是‘词’”的问题,各家的思想都差不多,依据的总不外乎是形态标准、语音标准、语义标准、语法标准,或者是某种综合标准,使用的方法也总不外乎“有没有某种形态标志”“替代法”“插入法”或者“是不是属于同一个重音单位”“有没有语音停顿”“整体意义是不是等于组成部分意义的总和”等等。如果这几方面的结论一致,那就没有争议;如果不一致,那就会有争议,而且谁是谁非很难说清楚。我们现在就处在这样一种境地。为了摆脱这种困境,多年来很多人在实践中已经积累了一些有用的经验,制订了一些行之有效的标准和操作手续,还有一些人则在进行不倦的探索,提出了一些新思路。但是一些初步看来行之有效的标准和操作手续往往不能一以贯之;有一些新思路很早就提出来了,可是始终没有人去具体操作,看看可行不可行,究竟能解决多少问题。这些问题都应该具体考察一番。 除此以外,还有一种问题也值得我们注意。那就是虽然谁也说不清楚什么是“词”,可是不论是语言学家,还是普通人,似乎都还有相当一致的关于什么是“词”的一种“语感”。这方面有一个著名的例子:50年代陆志韦对构词法进行了深入的研究,提出了一些判定“词”和“非词”的标准和操作手续,到目前为止这些标准和操作手续都还在使用,因为至今都还没有更好、更可行的标准和操作手续。根据陆志韦的分词标准,“中华人民共和国”应该是一个“词”,可是当时多数人认为不像一个“词”,令人惊讶的是连陆志韦自己都“觉得”不太“像”一个“词”而“像”三个词,也就是:“中华”“人民”“共和国”!所谓“觉得”,所谓“像”,正是一种语感,因为牵涉到像“词”不像“词”的问题,所以不妨称之为“词感”。分词标准跟“词感”不一致就行不通,这跟语法分析跟“语感”不一致就行不通一样,因为说到底,本民族多数人的语感是评判任何一种语言理论或处理标准的最高和最终的权威。在说现代汉语的人的语感中存在一种模糊的“词感”,这就可以证明现代汉语中的确客观存在一种比“语素”大,比“短语”小的可以称之为“词”或别的什么名称的语言单位。不过吕叔湘指出,不同文化程度的人对什么是“词”的感觉是不完全一致的(1979:16),因为很多现代汉语的语素在古代汉语中是十足的“词”,所以同样一个双音节或多音节单位,熟悉古代汉语的人会觉得是由“词”组成的“短语”,而不熟悉古代汉语的人会觉得是由不能单用的语素组成的“词”。一般说来,语言学家和词典编纂专家对古代汉语都比较熟悉,所以由他们制定的分词规范总是偏“严”,不少该是“词”的单位就有可能成不了“词”,而永远是“短语”。那么专家跟普通人的“词感”到底有多大差别呢?我们多年来很想进行一次广泛的社会调查,看看普通人对现代汉语的“词”或者说是近乎“词”的这种语言单位的“语感”是什么样的,因为“词”这样的语言单位最终还得由使用现代汉语的广大群众来认定或认可,语言学家想“我辈数人定则定矣”是行不通的。近来武汉江汉大学的王立同志在《语言文字应用》上发表一篇调查报告文章。作者从6种汉语普通话和对外汉语教材中选择了25 个“单音动词+单音名词”结构,调查结果总的倾向是作为一个“词”来处理的。这位作者还用一段包含43个“双音节名词性偏正结构”的文章,通过1200份问卷(收回有效问卷1139份)在不同文化水平和不同职业的普通人中间进行了一次调查,要求调查对象划出他们认为是“词”的结构单位,把调查结果跟《现代汉语词典》、《辞海》、《常用构词字典》(傅兴岭、陈章焕编,中国人民大学出版社,1984年版)、《词汇》(宋长庚、赵玉秋编,北京华龄出版社,1994年)、《常用字和常用词》(北京语言学院出版社,1985年)这五部词典的收词情况进行比较,结果发现收词情况大不相同。这43个双音节语言单位,这五部词典收为“词”的平均占43.73%,普通人认为是“词”的平均占93.43%,相差49.70%。 (王立1998b)但是这五部词典的情况也有较大出入, 《常用字和常用词》只收了16.3%,《常用构词字典》收了76.7。这种差异显然是由于词典的性质不同造成的,因此我们不宜把统计数字绝对化,因为任何社会调查的统计数字跟自然科学的数据不同,只能代表一种倾向性。最近我们建议在北京进行一次类似的调查。陈松岑教授很快就在北京大学文理各系的学生中进行了调查,结果跟武汉王立的调查惊人地相似,北京大学包括中文系学过汉语语法的学生的“词感”,跟语法学家的分词标准相去甚远。普通人认为“蓝天”“白云”“小鸟”“湖边”“松树”等等都是“词”,可是大多数语言专家和词典编纂专家认为这些语言单位都是“短语”,不是“词”。我们并不主张“盲从”普通人的“词感”,但是我们认为对广大群众的“词感”完全不予考虑恐怕是行不通的。相反,对群众的“词感”,我们应该认真考虑。