1.引言 语言事实中的词语搭配描述,在语料库出现之前,大多依赖研究者自己的随机收集或语感判断,其全面型和代表性恐怕难以保证,研究结果具有一定的局限性。随着语料库语言学的兴起,词语搭配研究增加了新的研究手段与方法,研究效度得到提高,搭配行为的描述因此更加深入和详尽。 语料库库数据支持的词语搭配研究主要有两种方法:基于数据的方法和数据驱动的方法。前者以关键词为中心,以语料库索引数据为依据,研究者在传统语法搭配类型的框架内依据数据对结构内词项的组合行为进行检查和概括。数据驱动的方法没有传统语法等先入为主的观念,而是靠自动化程序对语料库中关键词的所有搭配词进行提取和统计测量,得出显著搭配词,所有的研究和描述都由数据引导进行。 本文将利用上述两种方法,对“有点”的左右搭配进行实例研究,并分析每种方法的特点和实用性。右侧搭配的考察将使用基于数据的方法,着重观察“有点”被饰搭配词的类联接及其语义特点;左侧搭配的考察将使用数据驱动的方法,旨在发现“有点”附加搭配词的语义类别。本次搭配考察所用语料采自厦门大学海外教育学院中文语料库和台湾“中央”研究院的现代汉语标记语料库4.0版(简称ASC)。前者的特点是语料来源全部是普通话口语与书面材料,后者的特点是提供了检索、词类标记、排序、过滤、搭配统计等多种功能。 2.基于数据的研究方法 在语料库基于数据的研究方法中,涉及到的一个重要概念就是类联接(colligation)。卫乃兴(2002)[1]指出类联接是语法范畴间的结合,或者说它是关于词语组合类别的抽象表述,是具体的词语搭配发生于其中的语法结构和框架。类联接建立后,就可以据此描述和概括搭配词的语义特点了。 以“有点”为例,它在厦门大学海外教育学院中文语料库中的原始有效频数为1421。我们以这 1421个实例为据,检查它搭配词的语义特点。限于篇幅,现将其中随机抽取的10行含有关键词的句子片段列在下面,它们也称索引(concordance)。词语搭配研究所用的索引一般是KWIC(key word in context)索引,在每一行索引中,关键词总是居中出现,而左右两侧则是构成其语境的词语,研究者可据此分析该关键词的搭配特点: 1据说你对《三国》好像是有点研究。 2 因为自己吃了,哭起来不免有点过意不去。 3我有点旁的事,要先跟他谈谈。 4左右的男子,他耳朵长得有点奇怪,耳垂部分堆积了多余的廓线,看 5长得矮,又开始发胖,是有点像土豆。 6闹得我有点不好意思了,觉得自己活像个刚进大观园 7 他的父亲好像挺粗暴的,小峰 有点怕他的父亲。 8由于第一次出庭,彭致远有点紧张。 9 声音有点凄楚,和呜咽相近。 10 好像有点太女性化了! 2.1 类联接考察 根据观察,“有点”的右侧搭配可用于+AP,+VP,+NP,+S4个类联接,分别代表“有点”与形容词 (组)、动词(组)、名词(组)和习用语(包括成语)的搭配。其中+AP最多(533),占全部索引的38%,包括的高频搭配词有奇,隆(16),紧张(13),怪(12),急(10),累(9),尴尬(9),乱(7),不耐烦(7),惊讶(6),得意(6),不自在(6)等。+VP紧次之(475),占全部索引的33%,包括的高频搭配词有像(69),怕(18),害怕(12),后悔(10),失望(9),喜欢(8),生气(7),感动(6),恼火(6),怀疑(6),担心(6),吃惊(6)等。+NP(280)占20%,包括的高频搭配词包括事(33),意思(13),味道(8),精神(6),感觉(6)等等。+S频数最少(133),占9%,包括不好意思(23),不知所措(11),不可思议(5),莫名其妙(4),心不在焉(3)等等。 其实,“有点”在这4个类联接中,其“身份”也有所不同,在+NP组合中它作为动词与后面的NP搭配,我们称其为动词性的“有点”,搭配成分为名词类;而在+AP,+VP,+S等组合中它作为副词与其搭配,我们称其为副词性的“有点”,搭配成分是谓词类(注:据苏新春(2002)[4]《汉语词汇计量研究》中第九章对固定成语2736条所做的统计,其中2410条都是谓词类,功能相当于动词或形容词,百分比例高达88.08%。因此,实际上AP、VP和S类联接都可归为谓词类搭配。)。这两者比例为1:5,后接谓词类的副词性用法是“有点”的典型用法。 很多词典中都提到“有点”后面的词“大多为不如意之事”,事实如何呢?下面我们进一步分析这两大类搭配词的语义特点。 2.2 语义韵考察 考察前我们先要介绍一个相关概念,叫做语义韵(semantic prosody)。简单来说,这一术语是Sinclair借用Firth曾经使用过的“音韵”一词而新创的一个专为语料库语言学研究使用的术语,用来表示超越词界的联想色彩。(纪玉华、吴建平,2000)[2],这里所说的联想色彩是指由于经常与该词搭配的词语具有某一种共性(如大都是“好词”或“坏词”),使这个词也“沾染”了这种特性,从而使人们一看到这个词,就会自然地联想到这种共性。其实这有点“近朱者赤,近墨者黑”的意思。邹韶华(2001)[3]在其《语用频率效率研究》中提到的“语境频率联想”或者“同现联想”与此有异曲同工之处。语义韵大体可分为积极、中性和消极3类,其标准我们在这里采用邹韶华[3]中的宽泛定义:是否直接体现褒义褒贬色彩和隐含取舍评价态度,即若该词项为褒义词或者为当事人所羡慕、肯定和愿意接受的即为积极倾向,即“如意”;否则为消极倾向,即“不如意”;无明显主观趋向或评判意见的就属于中性。