自18世纪以来,汉藏语系这个假设的论证,经过许多代人的努力,虽取得了一定的进展,但比较起印欧语系来,仍然有比较大的差距。它的外延和内涵都还有许多争议;(注:见孙宏开、江荻《汉藏语系研究历史沿革》,载丁邦新、孙宏开主编《汉藏语同源词研究——汉藏语研究的历史回顾》第1—116页,广西民族出版社,2000年。) 主要涉及汉语、藏缅语、苗瑶语、侗台语、南岛语、南亚语。甚至还有人认为根本不存在汉藏语系语言,也有人认为北高加索叶尼塞一带的语言也与汉藏语有关系。 汉藏语系主要分布在东南亚次大陆,有数百种类型各异、千姿百态的语言,虽然经过各国语言学家的努力,我们陆陆续续、深浅不同地掌握了这些语言的特点,但是它们各自的演变脉络还不清楚,许许多多大小不同的语言群体之间的共性和特性还很不清楚,各语言之间、各语言群体之间的远近关系也很不清楚,至于整个语系的特点和演变脉络更是难以把握。例如在语音方面: 原始汉藏语到底是多音节的、一个半音节的还是单音节的?现在在藏缅语族、苗瑶语族、侗台语族的一些语言里保存的复辅音有二合的和三合的,少数藏缅语族语言里还有四合的复辅音。它们是后起的还是原始的遗存?相当于藏文的前加字、上加字所反映的复辅音是什么性质的,如果是后起的,是什么样的语法化过程使它们构成了这些复辅音?如果是原始的遗存,它们的结构形式有哪些,哪些形式是古老的,哪些形式有共同的来源?有人认为,类似前加字和上加字构成的复辅音,有两种来源,一种来自于原始汉藏语,另一种是语法化过程中来自于前缀的弱化,那么这两者如何区别?如果来源于前缀,那么,它们的意义是什么?与此相关的是原始汉藏语的辅音系统的框架是什么?有几套塞音系统,3套(双唇、舌尖中、舌根)还是4套(双唇、舌尖中、舌根、小舌)?有多少种发音方法,清浊2套还是清、浊、清送气3套?还是清浊各分送气不送气4套?现在汉藏语系语言里都有数量不等的塞擦音,有的1套,有的2套,有的3套,最多的有5套(舌尖前、卷舌、舌叶、舌面前、舌面中)。人们普遍认为,塞擦音是后起的,那么,产生塞擦音的条件是什么,汉语的“精”系字也是后起的吗?什么时候在什么条件下产生的呢?现存的汉藏语系语言大多数语言有介音系统,有的1个,有的2个,有的3个,最多的有4个,也有的语言至今没有介音。人们一般认为,介音是后起的语音现象,往往是复辅音后置辅音在历史音变过程中陆续向半元音然后再向介音转化。这个过程有先有后,有转有不转等,形成了现在不同语言介音系统的差异,什么条件促使了不同情况的转化?关于元音系统问题,目前在上古汉语的元音系统就已经存在着很大的分歧,有4分的、6分的、7分的等多种,各有各的道理,那么汉藏语的元音系统是什么样子的呢?至于元音分不分长短、松紧等,更是意见分歧。涉及韵尾问题有元音韵尾和辅音韵尾。很明显,元音韵尾和介音一样,在不同的汉藏语系语言里数量由0到4,一般认为也是后起的。那么,什么音素促使元音韵尾的产生和发展?辅音韵尾在汉藏语系语言里比较整齐,一般有鼻音、塞音和续音三类。多数学者认为,辅音韵尾是原始汉藏语的遗存,在不同的语言里,经历了由多到少,由少到无的演变过程。但是也有人认为,部分辅音韵尾来自于词缀。那么,原始汉藏语的辅音韵尾系统是怎样的,是否需要分析来自词缀的辅音韵尾?有没有复辅音韵尾,如果有,它们的结构形式是什么?辅音韵尾在历史音变的过程中对音节的哪些部位产生了影响?中国大百科全书说,声调是汉藏语系语言的重要特点之一,但一些汉藏语系语言至今仍然没有产生声调。汉语以及许多亲属语言的声调发生、发展事实表明,汉藏语系语言的声调并不久远,它的发生和发展与5个要素发生关系:1)声母的清浊;2)韵尾的历史音变;3)复辅音的脱落和性质的改变;4)语素的合并;5)语言之间的互相影响。在声调发展变化的过程中,5个要素中哪些是主要因素?此外,从声学原理来看,声调产生的机制究竟是什么,为什么汉藏语系绝大多数语言都产生了声调,包括喜马拉雅南麓与汉语有同源关系但没有接触关系的语言。为什么与汉语发生学关系比较远的苗瑶语、侗台语的调类(四声八调)与汉语那么一致,是接触形成的吗?与汉语接触更早、更深的藏缅语为什么没有与汉语一致调类?与汉语也有密切接触关系的阿尔泰语系语言以及朝鲜语、日语为什么至今没有产生声调,而属于南亚语系的越南语以及中国境内的少数南亚语则产生了声调?等等。与语音相关的问题还有:原始汉藏语的音节是否既有阴声韵也有阳声韵的区别?换句话说,就是既有开音节,也有闭音节,分析原始汉藏语系的语音系统采用元辅音分析法好还是声韵母分析法好? 语法方面:人们普遍认为,汉藏语系语言属分析型语言。但大量语言事实表明,与汉语关系最密切的原始藏缅语族语言语法系统中却有丰富的前缀和后缀,来表达丰富的语法范畴,这种丰富的词缀并不比粘着型的阿尔泰语简单,甚至有过之而无不及,其中有的能够在汉语中找到对应,例如动词的使动、名词的人称领属、代词的格等等。那么,藏缅语族大量的前后缀是后起的呢,还是原始汉藏语的遗留?或者两者兼而有之?无论是那一种情况,都有一大堆的问题需要论证和解决。语序是汉藏语系表达语法意义的重要手段,汉藏语系的基本语序有SVO和SOV两大系列,如果再加上南岛语和南亚语,语序类型就更加复杂。人们都在推测原始汉藏语应该是SOV型的语序,那么为什么到汉语、侗台语、苗瑶语转换为SVO了呢,这种转换的历史过程和动因是什么?与之相适应的一系列相关语序的变革又是怎样发生的呢?汉语、侗台语、苗瑶语表达句子结构关系的介词是前置的,但藏缅语族语言相同语法意义的结构助词却是后置的,它们又是经过了什么样的语序转换过程呢?量词是汉藏语系语言的一个显著特点,但是直到现在,藏语以及中国境内的部分藏缅语族语言、喜马拉雅南麓的一大批藏缅语族语言,量词至今还没有从其他词类中分化出来,量词的数量还很少,它在语法体系中的作用还非常小。因此人们认为,汉藏语系语言的量词是陆续发展起来的,其数量经过了由少到多,功能经过了由弱到强的语法化过程,它们在语法体系中的作用也越来越大。而这种作用往往与该语言形态作用的大小成反比。那么,什么内在机制诱发了量词的发展?是单音节化(包括语法形式分析化)、认知机制还是什么其他原因?历史语言学告诉我们,形态的对应是同源关系的确凿证据,藏缅语族语言内部的一些形态对应比较容易发现和证明,往往某些有亲缘关系的语言里,形态手段的消失呈链状演变过程。(注:详情请参阅拙作《藏缅语语法结构类型的历史演变》,载《民族语文》1992年第5、6两期。) 但是语族之间的形态对应的证据却非常难找。近来,人们从历史类型学的角度找到了突破。人们发现,语言结构类型也会发生变化,有的时候,这种变化的速度还比较快。原则上说,有亲缘关系的语言,在原始类型上应该是一致的或接近的,如果我们能够找到相同或相近的类型转换的证据,是否也可以在一定程度上证明亲属语言之间的发生学关系? 在词汇方面:有语音对应关系的同源词的数量多少是证明语言亲属关系远近的重要证据,但是由于语言深度接触,语言之间词汇的借用有时候可以深入到核心词部分,使得同源还是借贷关系难以确定。因此人们另辟蹊径,寻找证明同源关系的方法,如深层语义对应、核心词阶分析、关系词的历史层次等等。最近,人们又在寻找词族的证据,希望从不同语言词族的对应找到同源关系的突破口。但是无论采用哪种方法,找到一批确凿的不同历史层次的同源词或者同源词族,是证明语言发生学关系的重要证据。最近,有人发现,由于长期语音、语义的历史演变,某些词汇(语素)已经渗透到构词乃至构形的层面。因此主张语言的历史比较研究应该打破词汇和语法的界限,从同源语素的角度来论证语言的发生学关系。总之,无论从哪个角度进行研究,基本资料是开展研究的先决条件。古人说,兵马未动,粮草先行。为此,现在我们已经初步建立了一个包括130种语言和方言,服务于历史比较研究的词汇语音数据库,并且,希望在不久的将来,继续扩大规模,建成一个服务于各种目标、各种不同层次、不同语言集团历史比较研究的词汇语音数据库和词典库,以促进汉藏语系语言的历史比较研究。