秦简牍文献用字习惯计量研究

作 者:

作者简介:
姜慧(1989-),女,山东青岛人,上海辞书出版社文字学博士,主要从事语文辞书编纂(上海 200040);张再兴(1968-),男,浙江新昌人,博士,华东师范大学中国文字研究与应用中心教授,研究方向是古文字信息化处理和古文字学研究(上海 200062)。

原文出处:
语言研究

内容提要:

基于秦简牍文献语料库,立足于用字频率、字形选择和字词关系的不同视角,对秦简牍文献的用字习惯进行考察。通过深入分析秦简牍文献的用字现象和文献分布,指出其用字总体上比较规范,具有显著的形声化等发展特征。


期刊代号:H1
分类名称:语言文字学
复印期号:2018 年 02 期

字号:

      用字习惯是指在一定时期的文献中,为表示某词而选用某字的约定俗成的用字倾向。出土文献未经后世改动,年代相对明确,为用字习惯的断代研究提供了真实的资料。本文研究所依据的材料包括放马滩简、睡虎地简、里耶简、岳麓简、周家台简、龙岗简及若干秦代的小宗散简,文献总字数约112000字。为尽量使各项统计结果相对科学,我们排除了具有争议和存疑的用字字组。

      一、频率视角的用字习惯考察

      在文字发展过程中,能够称得上习惯的用字现象,必须已达到一定的频率规模,而不能仅仅是偶尔的、零星的用字。一种文字系统的使用特点也正是通过这些成规模的用字习惯来体现的。因此,用字习惯的考察应当首先从频率的视角进行。在随后的讨论中,我们也将主要聚焦于高频的用字字组。

      通过基于秦简牍文献语料库对其用字情况进行的穷尽性定量统计,秦简牍文献中有1016个用字字组,共出现5498次。与秦简牍时间相近或稍早的楚简帛中,共有用字字组4398个,总频率为19501次。相对于总字数为89000多字的楚简帛文献,秦简牍文献中的用字要规范得多。

      按照使用频率,我们可将秦简牍文献用字划分为不同等级的字组:使用频率为100次以上(均含端点,下同)的为最常用字组,30次以上的为常用字组,10次以上为次常用字组,2次以上的为不常用字组,仅1次的为单次用字字组。不同等级字组的具体分布情况见表1。

      

      从整体上看,秦简牍文献中只有少量用字集中于高频常用字组,尚有大量的单次用字字组在使用,其使用数量已经达到了581个。其中,相对于非常用字组,96个较常用字组的用字总量在实际用字总量中占据了极高的比例,即较常用字组作为秦简牍文献的高频用字,其用字的特征性较强,呈现出具一定频率规模的约定俗成性。从各个字组的内部看,7个100次以上的字组数仅占总组数的0.69%,其用字量却占用字总量的24.28%。581个单次字组数占总组数的57.19%,其用字量则占用字总量的10.57%,二者的使用比重差距悬殊。可见,与秦简牍文献中的单次用字字组相比,虽然较常用字组并不是很多,但其社会认同程度较高。这些字组能够反映出当时相对固定的用字习惯。

      秦简牍文献中最高频的用字字组及频率分布情况如下:殹(也)400、可(何)223、毋(无)180、五(伍)142、智(知)140、辠①(罪)128、有(又)122。在以上高频字组中,居于前两位的“殹(也)”和“可(何)”分别为语气词和疑问代词,均为虚词。从高频字组的内部看,二者的使用频度明显高于其他字组。这表明秦简牍文献最高频的字组用字呈现出不平衡的分布特点。此外,随后的“毋(无)”、“五(伍)”和“智(知)”等字组,都是法律文书中常见的动词或名词,多出自程式化的用法或固定搭配,其使用比重差别不大。可知,秦简牍文献集中度较高的高频字组的分布具有不平衡性,这一特征与文献的内容密切相关。

      从较常用字组的本借字关系看,相对于只有23组的纯同音通假的用字,分化字的用字已经达到了67组,占较常用字组数的69.79%。这说明分化字在秦简牍文献较常用字组中占据明显的优势地位。从发展的角度看,这些高频分化字具有形态和功能的不一致性:虽然它们在表示语词的功能上已经分化,但在实际的使用形态上多依旧选用分化所从出的字形,尚未使用新的分化字形。

      从地域角度看,秦、楚共有的用字字组是“智(知)”和“可(何)”,这说明二者的用字习惯属于时代传承性的特征。与此相对,“殹(也)”、“有(又)”和“毋(无)”等习惯用法在楚简帛文字中未见或罕见,反映出这些用字是属于秦文字的特点。“五(伍)”、“辠(罪)”等用字则主要与秦简牍文献的内容特征相关。

      从时代角度看,到了西汉早期简帛文献时期,高频习用字组中的“毋(无)”、“有(又)”、“智(知)”等依然存在,这说明它们的字词关系仍尚未定型。而“殹(也)”、“可(何)”、“五(伍)”和“辠(罪)”等字组则已不见,这显示出其用字已经发生了重大的变化。

      二、字形选择视角的用字习惯考察

      记录词的字形选择既是个人的习惯,更是社会约定俗成的结果。同时,这也体现了文字系统发展演变的过程。秦简牍文献在文字的使用过程中,既有本字和借字同时使用的情况,也有只使用借字的情况。

      (一)同时使用本字和借字

      秦简牍文献用字中本字和借字都存在的共见字有199组。其中,本字的使用频率高于借字的共见字(A类)139组,本字的使用频率低于借字的共见字(B类)47组,频率相当的字组(C类)有13组。

      在A、B两类中,本字和借字的数量差异有的很大,有的则比较接近。我们分别选取两类用字的前20位高频共见字进行分析,如下页表2。

      A类用字情况中有许多字组的使用频度比较低,当属于临时性的借用。如伪(为)、伍(五)等。其中使用频度稍高的一些字组应该属于某种文献的用字习惯,如“訾(赀)”共10例,均分布于岳麓简。从整体上看,秦简牍文献高频共见字中A类用字的高频集中度和使用密度远高于B类。从文献分布看,A类用字中借他字以记录本字的少量用例多集中分布在秦代早期和中期的日常私用性文书中。例如,相对于861例直接写作“三”的用字,借用“参”表示“三”的12个用例中,有10例分布在放马滩简的《日书乙种》篇中。另有2例分别分布在岳麓简《占梦书》篇3简和周家台简《病方及其他》篇374简中。此外,还有字组的用字习惯属于意义和功能的分化,例如“节(即)”(姜慧、张再兴2017)。

相关文章: