定中式形名组合词长搭配的量化研究

作 者:

作者简介:
祁峰,华东师范大学对外汉语学院(上海 200062),中国社会科学院语言研究所(北京 100732);端木三,美国密歇根大学语言学系。

原文出处:
语言教学与研究

内容提要:

本文从量化研究的角度来讨论定中式形名组合[1+1]、[1+2]、[2+1]、[2+2]结构的词长搭配问题。本文使用兰卡斯特汉语语料库(Lancaster Corpus of Mandarin Chinese),通过分析,得出以下结果:一、在定中式形名组合[1+1]、[1+2]、[2+2]、[2+1]四种组配模式中,[1+1]出现的频率最高,其次是[1+2]或[2+2],[2+1]最低。二、[2+1]相对于其他三种组配模式而言,出现的数量极少,而且主要局限于少数特殊结构;它跟名名组合中的[1+2]和动名组合中的[2+1]一样,都不是一种能产结构。三、语料的语体差异会导致统计数据的部分不同,但是不影响总体结论。


期刊代号:H1
分类名称:语言文字学
复印期号:2015 年 12 期

字号:

      一 问题的提出

      汉语的词长搭配出现在各种组合中,如名名组合、动名组合、形名组合等。就各组成成分的词长而言,主要有[1+1]、[1+2]、[2+1]、[2+2]四种组配模式。这方面的相关讨论很多,如吕叔湘(1963)、吴为善(1986)、陆丙甫(1989)、Lu & Duanmu(1991、2002)、冯胜利(1996、1998)、张国宪(1996、2005)、端木三(1999、2000、2012)、王洪君(2001)、王灿龙(2002)、周韧(2007)、柯航(2012)等。

      先看下面这些例子(转引Lu & Duanmu 2002):

      2+2 2+1 1+2 1+1

      (1)名名(偏正):手表工厂 手表厂 *表工厂 表厂

      技术工人 技术工 *技工人 技工

      煤炭商店 煤炭店 *煤商店 煤店

      (2)动名(动宾):阅读报纸 *阅读报 读报纸 读报

      表演戏剧 *表演戏 演戏剧 演戏

      种植树木 *种植树 种树木 种树

      例(1)中,偏正关系的名名组合[1+2]不好(如“表工厂、技工人”);例(2)中,动宾关系的动名组合[2+1]不好(如“阅读报、表演戏”)。这两种结构,好的例子不是没有。比如,[1+2]的名名偏正有“棉大衣、皮手套、木地板、系主任、党支部、县医院”等,[2+1]的动宾有“喜欢钱、研究鬼、举起手”等,这些例子,王灿龙(2002)已经有所注意。不过,名名的例外限于两种特殊情况,即第一个名词属于材料(“棉大衣、皮手套、木地板”一类)或所有格(“系主任、党支部、县医院”一类)。根据语料统计,除去特殊情况以后,(1)和(2)的例外,出现率不到1%。(Duanmu 2012)因此,我们可以认为,名名偏正的[1+2]和动宾的[2+1]都不是完全合格的结构,一定违反了某些语法或韵律要求。

      下面再看另外一组例子(转引张国宪2005):

      2+2 2+1 1+2 1+1

      (3)名形(主谓):晨雾浓密 胆子小 *雾浓密 胆小

      地板潮湿 地板湿 *地潮湿 地湿

      牧草茂盛 夏天热 *草茂盛 天热

      (4)名形(偏正):鹦哥绿 草绿

      铁锈红 肉红

      宝石蓝 天蓝

      (5)形名(偏正):荒诞文学 荒诞戏 脏衣服 脏水

      贫困山区 贫困县 凉馒头 凉面

      豪华汽车 豪华车 旧报纸 旧书

      例(3)—(5)在张国宪(2005)中分别属于形名组合的三种词长组配模式,他称之为组配扭曲、组配缺位和组配自由。主谓式名形属于组配扭曲,可以有[1+1](如“胆小”)、[2+1](如“胆子小”)、[2+2](如“晨雾浓密”),但是不能说[1+2](如“雾浓密”)。定中式名形属于组配缺位,只有[1+1](如“草绿”)、[2+1](如“鹦哥绿”)。相对于这两种组配模式,定中式形名属于组配自由,可以有[1+1](如“脏水”)、[1+2](如“脏衣服”)、[2+2](如“荒诞文学”)、[2+1](如“荒诞戏”)。

      在例(3)里,“*”号也许表示一个反例也没有。在例(4)里,空格也许表示反例极少。虽然张国宪没有提供量化数据,但我们基本同意他的判断。下面我们主要讨论例(5)一类偏正式形名结构。

      偏正式形名组合的词长搭配问题,文献中已经有所讨论。例如,王洪君(2001)认为,在四种词长搭配中,[2+1]最受限制,能说的实例最少;其次受限制的形名组合依次是[2+2]和[1+1],限制主要在于这两种形式的结构可能有歧义,特别是[2+2];[1+2]作定中几乎不受限制。也就是说,按照各种搭配形式出现数量的多少可做如下排列:[1+2]>[1+1]>[2+2]>[2+1]。再如,张国宪(2005)认为,这种结构中,形容词与名词的音节组配呈现自由态势,即[1+1]、[1+2]、[2+2]和[2+1]这四种组配模式都可以,不过在语义的无标记性程度上大致表现为:[1+1]>[1+2]>[2+2]>[2+1]。

      上述的这些研究都缺少数据的定量分析。比如说,王洪君和张国宪都认为定中式形名组合中[2+1]最少,但是到底少到什么程度,两位并没有进一步说明,从而给理论探讨留下了一个疑点。上面提到,例(1)偏正关系的名名组合[1+2]、例(2)动宾关系的动名组合[2+1]都有一些例外,不过数量太少,所以总的来说是不好的结构。对于例(5),前人一致认为,[2+1]出现率最低。那么,有必要证实一下,到底低到什么程度。比如,如果[2+1]只有2%以下,那么它很可能受到某种语法限制;如果[2+1]有10%,那么它也许可以算是正常结构。再比如说,定中式形名组合中到底是哪一种组配模式最多,是王洪君所说的[1+2],还是张国宪所说的[1+1]?因此本文希望从量化研究的角度来分析定中式形名组合中各组成成分的词长搭配问题,以利于进一步的理论探讨。

相关文章: