中国是世界上语言多样性最丰富的国家之一。中国语言的多样性不仅表现在语言谱系复杂,语种数量众多,并且语言(特别是汉藏语系语言)内部方言之间的相似度和可懂度也较一般意义上语言的方言变体更低,以致在中国同一语言的方言经常被国外学术界视为独立的语言。因此国内外关于中国语言数量的统计结果,存在着比世界上其他国家语言更大的差别。以权威中外文献关于中国语言数量的统计为例说明。(见表1)
国内外学术界关于中国语言数量统计结果的差别是因为采用不同的语言识别标准所致。即国内民族语言学界比较注重:(1)民族对语言识别的作用。在中国,语言是构成民族的基本要素之一,反之民族也是语言识别的重要参数。(2)同源词对语言识别的作用。同一种语言的各方言之间一定要有相当比例的同源词;将属于历史语言学范畴的同源词用于共时方言划分,是借鉴于汉语方言依据古代汉语音韵特征进行方言分区的方法。(3)语言结构类型标准。即属于同一种语言的各方言之间要有结构类型的相似性。(黄行2009)国外学界通常强调语言和方言的区别在于:(1)通话的可懂度(intelligibility)。语言内方言要有较高的可懂度,否则应该是独立的语言。(2)说话人对民族语言群体(ethnolinguistic group)的认同度。如两种话之间有较高的可懂度,但是语言使用者并不认同为相同的语言,也应看作不同的语言。 国际组织(如联合国教科文组织和国际标准化组织)公布的世界语言共有约7000种,主要是依据世界少数民族语文研究院(SIL International)编纂并每5年修订一次的Ethnologue:Languages of the World(本文译作《世界民族语言志》)一书所基于语言可懂度和认同度标准的识别结果和统计数据。该书最新的2017年第20版共收录世界7099种语言(Lewis et al.2017),其中中国大陆收录了299种,加上中国台湾收录的25种(多数为台湾南岛语系语言,也包括与大陆相同的汉语官话、闽南话和客家话,不同国家或地区的同一语言不会重复统计在语言总数之内)、中国香港7种(大陆没有的是英语和属于克里奥尔语的澳门土语Macanese)、中国澳门6种(大陆没有的是葡萄牙语和澳门土语)。合计中国不重复的语言有323种(占世界语言总数的4.5%),其数量是国内学界认定的中国语言的两倍多。 客观地讲,上述文献对包括中国语言在内的世界语言身份识别与统计结果,已经形成一定学术认知度和国际标准的影响,因此本文拟从微观和实证的角度对中国与上述国际组织关于中国语言的谱系分类、身份识别和方言划分的差别做一客观的分析和评价。采用的中国民族语言数据主要来自《中国大百科全书》(2011)、《辞海》(2009)、《中国少数民族语言简志丛书》(修订本)(2009)、《中国新发现语言研究丛书》(1998-)、《中国的语言》(2007)和《中国语言地图集》(第二版)(2012)等权威文献。 二、语言谱系分类 中国学界采用的中国语言谱系分类基本仍为汉藏、阿尔泰、南亚、南岛、印欧五大语系及其以下各分若干语族语支的体系(《中国大百科全书》等)。 《世界民族语言志》关于中国语言的谱系分类和分布与中国区别不大,但是语言系属的层级差别很大,主要是取消了一些有争议的语系,将下位的语族升级为语系、语支升级为语族,甚至一些语言(如苗语、彝语)的方言升级为包含许多语言的语支,还有的方言甚至次方言土语升级为独立的语言。具体分类情况为: 汉藏语系仅包括汉语(Chinese)和藏缅语族(Tibeto-Burman),藏缅语族的层级极其复杂,语言数量也甚多,共含441种语言,但多未分布在中国。 侗台语族升级为“台-卡岱语系”(Tai-Kadai),其下再分侗台语族[Kam-Tai,含侗水(Kam-Sui)、台(Tai)、拉珈(Lakkia)语支],黎语族[Hlai,含黎(Hlai)和加茂(Jiamao)语支],卡拉语族(Kra,含中部、东部和西部语支,所谓“仡央语支”诸语言即包含于卡拉语族各语支)。 苗瑶语族升级为“苗瑶语系”(Hmong-Mien),分苗语族[Hmong,含黔东(Qiandong)、湘西(Xiangxi)、川黔滇(Chuanqiandian)、布努(Bunu)、巴哼(Pa-hng)等语支]、畲语族(Ho Nte)和瑶语族[Mien,含标交(Biao-Jiao)、勉金(MianJin)、藻敏(Zaomin)等语支]。 阿尔泰语系未设,其下的三个语族分别升级为语系: 突厥语系(Turkic),大多数语言分布在中亚和西亚,中国的突厥语系语言分属东部、北部、南部语组; 蒙古语系(Mongolic),包括中国在内的大多数蒙古语系语言都属东部语组,西部语组仅指阿富汗的莫戈勒语(Mogholi);