中国北方人口较少民族主要分布于黑龙江、内蒙古、甘肃、青海、新疆等省(自治区),据全国第六次人口普查(2010)数据,按人口数量多少分别为:土族289565人、锡伯族190481人、柯尔克孜族186708人、达斡尔族131992人、撒拉族130607人、塔吉克族51069人、鄂温克族30875人、保安族20074人、俄罗斯族15393人、裕固族14378人、乌孜别克族10569人、鄂伦春族8659人、赫哲族5354人、塔塔尔族3556人。 中国北方人口较少民族使用的语言共计有15种,阿尔泰语系13种,其中,突厥语族语言5种,蒙古语族语言4种,满—通古斯语族语言4种;印欧语系2种。其中,含跨境语言8种。拥有传统文字的语言3种,有新创文字的语言1种。 2015年以来,我们开展了北方人口较少民族语言资源保护专题的深度调查研究工作。先期主要涉及达斡尔、保安、鄂温克、鄂伦春、锡伯、撒拉等阿尔泰语系语言和中国境内印欧语系斯拉夫语族的俄罗斯语。调查进程中,适逢中国语言资源保护工程(简称“语保工程”)的实施,借助其东风和相关调查资金支持,我们陆续扩大到了东部裕固、土族、赫哲等蒙古语族、满-通古斯语族语言,柯尔克孜、乌孜别克等突厥语族语言及印欧语系伊朗语族的塔吉克语,基本上实现了北方人口较少民族语言全覆盖。 在对调查材料整理研究过程中,我们陆续发现一些问题,其中最引人关注的是人口较少,尤其是具有濒危迹象的民族语言或方言的“词汇缺失”现象。如何认识“词汇缺失”现象,如何科学采集语料并精准保护民族语言,是我们一直在深入思考并探索的重要论题。实际上,词汇缺失也是较为普遍存在的现象。对词汇缺失现象的研究,有助于积累语言活力、语言资源类型差异的个案样本,于语保工程民族语言资源调查及语料整理也具有实践参考意义。 一、相关概念及说明 词汇缺失,是指在一种语言中原本不存在或由于某种原因出现空缺词语的总称。根据缺失的情况,可分为绝对缺失词汇和相对缺失词汇两类。根据其类别和义项,缺失情况可分为词汇义类缺失和义项缺失等。 (一)绝对缺失 绝对缺失或称自然缺失、客观缺失,指缺失的词汇系是非传统文化背景下产生的词汇。也就是一个语言原本没有的词,或不可能产生的词。如游牧民族语言缺失农耕民族的农业词汇,农耕民族语言缺失牧业词汇等。又如南方生长的很多植物、水果、蔬菜等的名称,在北方很多民族语言中都缺失等。也可能由语言结构本身及其演变特征而造成,如汉语有数量庞大且丰富的量词系统,但很多北方民族语言均绝对缺失此类词。另外,很多无文字民族语言缺失某些抽象词语的现象也较为普遍。 (二)相对缺失 相对缺失指某些固有词或原有的一些词汇,因各种原因导致流失或忘却,或称发展缺失、衰变缺失。也就是在民族语言中有据可考,原本应有的词语,但因诸多因素而没能采集到的词汇,或因语言社会功能整体衰变而导致常用词长期不用而逐渐淡出人们的记忆而缺失的词汇等。词汇的相对缺失或可和词汇流失等概念相提并论。 此外,词汇缺失还可分义类缺失和义项缺失。义类缺失主要指原本有的某一义类的缺失现象。义项缺失则主要指多义词原本有的某一义项的缺失现象。义类缺失与义项缺失更适于在一种语言内部进行微观分析。 (三)相关说明 本文的调查研究主要根据《中国语言资源调查手册·民族语言》进行。该手册分为8个分册:藏缅语族、侗台语族(兼用于南亚语系语言)、苗瑶语族、突厥语族(兼用于塔吉克语)、蒙古语族、满-通古斯语族、俄罗斯语、朝鲜语①。每个分册均分“工作规范”(包括调查规范、语料整理规范)和“调查表”(包括概况、音系、词汇、语法、口头文化、地方普通话)两大部分。为便于使用,各分册单独印刷装订。调查手册中的词表分各民族语言通用的1200条通用词和按照语族或语言分别设计的1800条扩展词,均分天文地理、时间方位、植物、动物、房舍器具、服饰饮食、身体医疗、婚丧信仰、人品称谓、农工商文、动作行为、性质状态、数量、代副介连词14类。其中,阿尔泰语系三个语族的1800条扩展词绝大多数基本一致,部分词汇兼顾了不同语族的特点。俄罗斯语和朝鲜语的1800条扩展词则兼顾了各自语言的词汇特点。 本文基于上述调查手册所采集到的词汇缺失材料的整理与分析:首先对语保工程民族语言调研专项任务所设的33个调研点的词汇缺失情况按照通用词和扩展词进行了初步统计,对某些语种或方言词汇记录中的问题进行了初步核对和甄别,并在此基础上选择了于后语种的典型代表点来进行对比分析,它们是:突厥语族的柯尔克孜语南部方言、撒拉语街子方言;蒙古语族的达斡尔语布特哈方言、土族语互助方言;满-通古斯语族的锡伯语察布查尔方言、鄂温克语敖鲁古雅、辉、陈3个方言;印欧语系斯拉夫语族的俄罗斯语伊宁、额尔古纳2个方言。而突厥语族的西部裕固语、乌孜别克语、塔塔尔语,蒙古语族的东部裕固语、保安语,印欧语系伊朗语族的塔吉克语等语言因涉及复杂的细节问题暂时排除在外,将另立专题讨论。另外,因相关统计数据工作量巨大,某些细节未及兼顾,可能在数据统计基础上的分析还不够全面详尽,其涉及到的相关论题研究也将期待后续数据的补充完善而继续推进。