一、语言类型学:从形态到功能的语言分类研究 “类型”是具有共同特征的事物所形成的种类,分类是科学研究的一个重要环节,面对纷繁复杂的大样本研究对象,如何进行类型划分,对认识事物至关重要。分类研究在自然科学中往往是科学研究的基础,在人文社会科学中,尤其是在考古学、心理学、建筑学、语言学、文学等学科群中,类型学研究也有悠久的传统,已在各自学科群中发展成为具有鲜明研究特色的领域和方向。对语言进行分类,既可着眼于形态,也可着眼于功能,既可以侧重于对语言个性的挖掘,也可以强调对语言共性的揭示。侧重的方面不同,研究旨趣、研究内容、研究方法及手段都将大相径庭。语言类型学经历了古典语言类型学向当代语言类型学的历史演变,这种演变蕴含着语言研究在个性与共性、形式与功能等方面的视角转换。 古典语言类型学源于19世纪兴盛于欧洲大陆的历史比较语言学,强调对语言个性及差异性的揭示,主要根据形态差异确定语言之间的亲疏关系,进而建立世界语言谱系图。古典语言类型学具有明显的“欧洲中心主义”色彩。当时,一大批以印欧语为主的语言学家对大量“土著语言”(indigenous languages)进行归类尝试,根据语言的形态特征,把语言分为曲折语、黏着语、孤立语、综合语等几个大类[1]。古典类型学着眼于语言的形态特征,因此又叫作形态类型学,这种分类即使到今天仍然影响着我们对语言类型差异的认知。形态特征的描写同时也为语言历史来源的考察提供了有力的证据,具有历史同源的语言往往具有相似的形态特征,这为建立世界语言谱系图奠定了基础。 当代语言类型学既是当代语言学的一个重要分支学科,也是当代语言学研究的一大学术流派。它是在古典语言类型学的基础之上发展起来的,但其研究旨趣不在于对语言进行简单归类,也不在于从各种类别特征中去寻求语言与语言之间的亲疏关系[2]。当代语言类型学更关注语言普遍拥有的特性,是关于“语言共性与语言类型”的研究,它对语言类型的区分建立在语言共性的基础之上,核心思想为语言类型是基于共性的类型[3]。当代语言类型学通过跨语言比较研究视角,揭示人类语言中的普遍共性,发现和解释不同语言要素之间所蕴含的共同特征和普遍规律,有自己独特的理论旨趣、科学信条、研究内容和研究方法,已成为当代语言学研究的一门“显学”。 当代语言类型学一般从语义范畴及功能共性出发考察语义表达及功能实现在不同语言中的类型差异。当代语言类型学区别于古典形态类型学,是基于一致语义或功能范畴跨语言比较研究的“功能类型学”,尤其是格林伯格的“语序类型学”研究树立了功能类型学研究的典范。格林伯格是当代语言类型学的开创者和代表人物,他在1963年发表的《语法的某些共性:论有意义成分的序次》一文,从蕴含关系角度讨论了与语序相关的语法共性原则,这些原则是对不同语言之语音、形态、句法、语义、功能诸方面特征及其相互关系的概括[4]。跨语言比较的蕴含共性研究是当代语言类型学有别于古典形态类型学之根本所在,对语言经验事实的重视又有别于乔姆斯基形式语言学基于直觉的内省式研究范式。 21世纪以来,在借鉴国外类型学理论与方法的基础上,国内汉语语法研究逐步开拓基于汉语及方言的语言类型学新领域,推动了对汉语及方言类型特征的认知。尤其是语言库藏类型学,作为中国学者的原创性理论,致力于从跨语言比较视角系统描写汉语及方言的库藏资源,从库藏资源角度刻画语言之间的类型差异,同时为揭示更大层面的语言共性提供可比性基础,是一种具有“新描写主义”导向的语言类型学研究[5],一方面坚持当代语言类型学所秉持的基于经验的逻辑实证主义科学研究传统,另一方面致力于语言学理论的建设与创新,彰显了中国语言学尝试走自主创新的研究之路。 库藏类型学出现的原因、区别于之前语言类型学研究的特色、发展现状及未来发展方向等问题,都是大多数语言类型学研究者当前普遍关心的,亟待得到回答和澄清。当代语言类型学在研究中重视证据的直观性和多样性,倡导跨谱系、多语种的语言取样方法,在跨语言描写语言事实方面,除了对蕴含共性的归纳之外,还采用语义地图模型对语言中各种“实质共性”范畴进行描写归纳。这两方面共同体现了当代语言类型学对经验主义及逻辑实证主义的坚守,也暴露出“重事实、轻理论”的问题,直接催生了新的语言类型学研究范式即库藏类型学的崛起。本文从语言类型学研究特色的讨论出发,首先提供一个观察语言类型学历史发展脉动的视角,以探寻库藏类型学兴起的逻辑线索,着眼于语言类型学的研究特色,讨论多语种取样原则在语言类型学研究中的意义,并重点讨论语义地图模型对推动语言类型学理论发展所起到的特殊作用,进而讨论语言库藏类型学的相关问题,最后得出结论并提出展望。 二、多语种取样:基于多样性大数据的类型概括 自格林伯格以来,当代语言类型学始终坚持基于跨语言观察和比较的研究传统,通过对丰富语料的跨语言对比,发现语言的共性和规律。这种以观察为基础的研究尤其注重对语言素材的选择和描写,在本质上是归纳性的。在研究中,一般需要建立一个有充足语种样本并兼顾语言谱系、地域和类型的语种库。以格林伯格为例,他之所以能够发现那些与语序相关的语言共性规律,最重要的就是建立了一个涵盖亚、欧、非、澳及南、北美洲六大洲30种语言抽样的语种库。当然,与现在的类型学研究动辄成百上千的语种样本相比,这算不了什么,但考虑到当时计算机技术的发展水平,即使处理这30种语言的数据也实属不易。 语言类型学的这种语种多样性取样方法,得益于计算机信息技术的进步,为了保证样本客观、有效,语言取样应遵守严格的标准,尤其需要处理好以下几个问题[6]:(1)取样策略是否明确、详尽。无论采样方法性质如何,都必须明确使用何种分类及如何选择样本语言。只有这样,人们才可能合理评估,并决定这种方法是否适合他们的类型学调查。详尽明确的说明,一方面可以提供客观的标准以评估取样是否具有科学性,另一方面能够保证建立规范化的程序在电脑中处理样本,以期获得有意义的科学发现。(2)样本类型是否满足研究需要。不同的研究问题需要不同种类的样本。重要的是要知道该方法能产生什么样的样本,一定要清楚用特定的某种方法所获得的这个样本对世界各种语言来说,在哪些方面具有代表性,即这种取样方法到底能为研究人员提供什么样的样本,是概率样本、随机样本还是品种样本?(3)分类是否客观科学。取样方法必须能够基于不同的分类生成样本,而不是依赖于一个特定的研究议题。研究人员必须能够自由选择其分类,而不依赖于抽样方法,抽样方法仅涉及分类的形式属性。(4)样本是否具有普遍适用性。取样方法必须能够产生具有普遍适用性的样本,它不应针对解决某个特定的研究问题或仅涉及某个语言学领域的问题(如词序)。(5)样本规模是否合适。取样方法不宜在样本规模上设限。虽然大样本可能产生各种各样的偏差,但最终是研究者自己要对数据质量负责。(6)如何处理特殊语言的类别。取样方法必须明确样本抽取范围,说明在哪些地域、哪些语言谱系的语言中采样,同时要说明如何处置特殊的语言类别,如孤立语、洋泾浜与克里奥尔语、混合语、已灭绝语言、手语、秘密语言、人造语言、未定类语言等。(7)样本是否适合研究议题。取样方法必须确保能获得适合研究议题的样本,尤其是当研究者不希望其样本包含全世界所有代表性语言时,更要注意这个问题。比如,如果只对某种类型或某个特定区域的语言有兴趣,那么就必须明确指出在哪些方面做了调整,而这些调整会对取样产生何种影响或结果。