语言词汇中由两个字组合而成的单位,我们称之为双字组合。(注:字和语素、词有着质的不同,这一点早已成为汉语语言学界的共识。然而,现代汉语中的语素不但未必就是单音节的构词成分,而且还可能是非构词成分,词更不以单音节为常,因此,字在现代汉语词的构成中仍不失为一个有用的概念。)双字组合在现代汉语中很常见,根据我们的统计,《现代汉语词典(修订本)》(商务印书馆,1996,北京;以下简称《现汉》)收条目凡58481个, (注:这个统计数字是在排除了异体性的单位(如“飘渺”和“缥缈”,“耿直”“梗直”和“鲠直”)和纯由拉丁字母构成的单位(如“CD”“KTV”)之后得出的。 )其中单字有8795个,约占总数的15.039%,如“捋”“神”“秃”“也”;三字组合有4910个,约占总数的8.396%, 如“图书馆”“小气候”“羊肠线”“运动量”;四字组合有4798个,约占总数的8.204%, 如“所向披靡”“默默无闻”“康庄大道”“高等动物”; 五字组合有218个,约占总数的0.373%, 如“国家所有制”“无后坐力炮”“脚踩两只船”“小巫见大巫”;六字组合有104个,约占总数的0.178%,如“有过之无不及”“真金不怕火炼”“政治协商会议”“自由落体运动”;七字组合有48个,约占总数的0.082%, 如“按下葫芦浮起瓢”“不见棺材不落泪”“打开天窗说亮话”“国际日期变更线”;八字组合有50个,约占总数的0.086%,如“巧妇难为无米之炊”“百尺竿头, 更进一步”“兵来将挡,水来土掩”“成也萧何,败也萧何”;九字组合有7个,约占总数的0.012%,如“搬起石头打自己的脚”“第二次国内革命战争”“冰冻三尺,非一日之寒”“司马昭之心,路人皆知”;十字组合只有2个,约占总数的0.003%,是“留得青山在,不怕没柴烧”“只要功夫深,铁杵磨成针”;十二字组合只有1个,约占总数的0.002%,是“只许州官放火,不许百姓点灯”。将以上统计数字加合起来,双字组合之外的单位共计18933个,约占该词典收条总数的32.375%。 而双字组合有39548个,约占该词典收条总数的67.625%。 由上述统计数字不难看出双字组合在现代汉语中占有绝对的优势。 二 双字组合占绝对优势,是汉语词汇由古代发展到现代的一个显著的变化,也是现代汉语词汇的一个重要特征。汉语词汇的古代形式与今天是不大一样的,根据对赵诚先生编著的《甲骨文简明词典——卜辞分类读本》(中华书局1988, 北京)的统计, 我们发现该词典收条总数为2050个,其中多字组合单位只有461个,仅约占总数的22.49%,单字有1589个,约占总数的77.51%。 如果我们把历史的时针再上推到史前文明时期,更可推断当时的汉语的多字组合单位是无法与单字单位相匹敌的。 汉语词汇由单字单位发展成为多字组合单位,主要有如下两种方式:一,将无意义的字组合拼接起来成为一个有单纯意义的组合体;二,将有意义的字组合拼接起来成为一个有合成意义的组合体。语言中以无意义的字组合拼接而成的有单纯意义的组合体,可称为字组。以两个无意义的字组合而成的双字组分两种情况:一是音译外来词,二是连绵词。音译双字组在现代汉语中并不占很大的比例,《现汉》只收有227个, 仅约占双字组合单位的0.574%, 如“舍利”“安培”“分贝”“弥撒”;(注:《现汉》中收入的音译字组当然不仅限于双字的,还有三字的82个,如“马拉松”“荷尔蒙”“华尔兹”“开司米”,四字的12个,如“布尔乔亚”“阿弥陀佛”“法西斯蒂”“罗曼蒂克”,五字的1个,是“布尔什维克”,六字的2个,是“英特纳雄耐尔”“普罗列塔利亚”。)连绵双字组在现代汉语中也很有限,《现汉》收有293个, 仅约占双字组合单位的0.741%,如“斑斓”“彪炳”“轱辘”“孑孓”。 (注:这里把叠音单语素词(如“饽饽”“猩猩”“狒狒”“蝈蝈”)也计入连绵双字组。)语言中最具优势的是以有意义的字组合拼接而成的有合成意义的组合体。有意义的字被叫做语素,因此以有意义的字组合拼接而成的有合成意义的组合体,可称为语素组。以两个语素拼合而成的双语素组,即通常所谓的由两个语素构成的合成词。双语素合成词,《现汉》收有39028个,约占98.685%, 如“阿斗”“蔼然”“爱恋”“案牍”。(注:双语素合成词,既包括上面所举派生词和复合词,也包括一些待嵌格式,如“半…半…”“不…而…”“千…万…”“一…二…”“大…特…”“连…带…”“一…就…”“道…不…”。这样的待嵌格式《现汉》收有33个。)这说明,汉语双字组合词汇单位由古而今的发展不主要取一语素双音节的形式而主要取双语素双音节的形式。(注:一些人所认定的双字组合有些未必就是单语素单位,如近人符定一编撰的《联绵字典》所收的条目,大多数并不是连绵词而是合成词,如“徭役”“伯仲”“劳神”“大人”“参与”“凡庸”“大寒”“今昔”。) 三 一语素双音节的词汇单位被视作词而为词典收入,应该无人会持异议。这样的例子有很多,如连绵词“窈窕”“忸怩”“嶙峋”“踉跄”,外来词“逻辑”“坦克”“拷贝”“杯葛”。再进一步看,无论是三个、四个,甚至更多个音节形式,只要它们所代表的是一个语素,就都可没有争议地被划归词的行列,刘正埮、高名凯、麦永乾、史有为四位先生合作编纂的《汉语外来词词典》(上海辞书出版社1984)就收有三音节一语素的“萨其马”(满:sacima)、四音节一语素的“普鲁卡因”(英:procaine)、 五音节一语素的“额勒玛第加”(拉丁:grammatica)、六音节一语素的“摩诃质帝萨埵”(梵:mah ācittasattva)、七音节一语素的“海图鲁代讷密斯”(英:hydrodynamics )和八音节一语素的“克拉维辰巴达牟尔”(英:clavicembal d'amour)。