关于语言身份的识别问题

作 者:

作者简介:
孙宏开,男,1954年毕业于北京大学,现任中国社会科学院荣誉学部委员,民族学与人类学研究所研究员,中国民族语言学会名誉会长,美国语言学会名誉会员等(北京 100081)。

原文出处:
语言科学

内容提要:

全球有多少种语言,这是一个很难回答的问题。国际语言学界通常根据世界少数民族语文研究院(SIL)出版的Ethnologue提供的信息来确定语言的数量,但该书在收录世界语言资料时缺乏一定的严肃性。主要是由于语言身份的鉴定在国际上缺乏一种学术界比较公认的科学的可以量化的识别方法。文章围绕美国《科学》杂志于2009年讨论中国语言识别问题的文章为引子,讨论了语言身份鉴定过程中存在的一些问题,反驳了该文对中国语言识别工作的一些污蔑不实之词,提出需建立一种互通度与语言结构差异度相结合的语言身份鉴定方法,以引起讨论,求得一种国际语言学界都能够接受的语言身份识别的理论和方法。文章还认为在互通度标准以及技术在实践中还没有能够取得学术界一致认可之前,指派最终的语言代码是不成熟的做法。


期刊代号:H1
分类名称:语言文字学
复印期号:2014 年 06 期

字号:

      1 引言

      中国有多少种语言?全世界有多少种语言?这两个问题都很难回答。为什么?这里涉及语言身份识别的标准和方法问题,核心问题就是语言和方言的界限问题。近期,该问题引起了境内外一些学者的广泛关注。事情起因是我1988年发表了一篇题为《语言识别和民族》(《民族语文》第2期第9-17页)的文章,讨论了中国少数民族语言身份的识别问题。这篇文章的主旨是回答中国究竟有多少种语言,讨论了语言识别与民族的关系,讨论了识别语言的复杂性和必要性,提出了语言识别的标准,按照谱系分类远近关系的原则,文章附录列出了中国境内已经识别的120多种语言的名称及其谱系远近关系。该文引起了境外学者的关注,被译成英文于1992年刊登在美国加州大学的《藏缅区域语言学》杂志上。

      2 一封采访信

      经过了许多年,2008年冬,我收到由《中国科学》杂志编辑转来美国《科学》杂志专栏作家迈克尔·伊拉德(Michael Erard)的采访信,信中提出了15个希望我回答的问题,问题以及我的回答大致如下:

      问:您识别的第一种语言是什么?这项研究是于何时何地做出的?目前为止,您一共识别了多少种语言?

      答:我最早调查少数民族语言是在1953年,那时候我在北京大学学习,袁家骅老师带领我们记录侗语和水语。1954年毕业以后,我分配到中国科学院语言研究所工作,开始自己到广西、云南、贵州调查研究苗语和瑶语,直到1956年。那年夏天,研究所派我到四川调查研究羌语,在那里,我一直工作到1960年。其后,我的工作主要做新发现语言的识别工作,1960年,我去云南省的中缅边境地区,开展了独龙语、怒苏语的调查,1964年,在四川和云南开展了普米语、柔若语和阿侬语的调查,1976年,去西藏中印边界东段开展了达让语、格曼语、义都语、门巴语、仓洛语等的调查,1978年去甘肃、四川开展了白马语的调查,1979-1982年,在四川和云南开展了嘉绒语、尔苏语、史兴语、扎巴语、木雅语、尔龚语、贵琼语的调查,1987年,去四川开展了拉坞戎语调查。这些语言差不多都是最近调查发现,并写出了初步的调查报告的。自1992年起,我开始组织我的同事,在中国社会科学院和国家社会科学基金的支持下,立项一起开展中国新发现语言的调查研究。有10多所高等院校和科研单位的老师与我一起,逐个对一些新发现的语言进行深入的调查研究,每一种语言写出一部描写性著作,由我和我的同事主编,命名为《中国新发现语言研究丛书》,已经有近60种语言列入计划开展调查研究。现在已经有38种语言的著作出版。在2009年将有10多种新的著作问世。

      问:您现在仍然在进行田野调查吗?如果是的话,您在哪里进行田野调查?

      答:是的。我几乎每年都会抽出一定时间开展少数民族语言田野调查,不仅仅调查小语种,也对藏语、彝语、傈僳语、纳西语等进行过调查。我的研究领域主要是藏缅语族语言,调查的地区集中在西南几省。而且一旦开始记录具体语言,往往在村寨以及比较边远的山区。

      问:想向您了解,在中国,从事田野调查的最棒的语言学家们都是由哪些机构培训出的?或者说,接受了怎样的教育和培训背景?

      答:一般由高等院校。那里有中国语言文学系、少数民族语言文学系或语言学系,有专门训练记录语言的课程。有时为急需完成某个调查研究任务,也采取办语言调查培训班,用临时培训的方式。时间长的数月,短的一两周。针对语言调查开设的课程有普通语言学、语法学、词汇学、语音学、语言调查实习等。

      问:中国从事田野调查的语言学家们,通常是在哪些地区进行田野调查?或者说,在中国哪些地区能够获取最多的新语言,做出最多的语言识别工作?

      答:数十万人使用的语言一般不需要专门去识别,我们现在识别的语言,一般使用人口不多,从几十人、几百人、几千人,最多几万人,往往分布在比较偏僻的地区,或高山、或海岛、或边境、或人烟稀少的地区,交通不发达,生活不方便,遇到的困难是很多的,我最近发表过一篇文章,刊登在北京大学主编的《语言学论丛》第36辑上,叫《中国空白语言的田野调查》,较详细地描述了新发现语言调查研究的情况。

      问:您认为中国总共存在多少种将会被识别的语言?中国实际上总共存在多少种语言,总数是多少?

      答:我和我的同事最近出版了一部由我主编的书《中国的语言》,由商务印书馆2007年出版,该书收集了129种语言,但是我们现在实际已经识别了134种语言,因为那本书的截稿时间是20世纪末。至于语言的数量,我们和境外的学者在识别语言的观点和方法上有很大的分歧。我们比较严格,境外比较松。这一点我在1992年的那篇文章中已经提到了识别语言的标准。这是我们区别语言和方言的基本标准,不像境外的学者以是否能够听懂作依据。

      问:我们非常想了解中国的语言学家在这方面作了哪些工作?您可否给我们推荐一些其他的作相关研究的语言学家,提供他们的联系方式,我们想跟他们聊聊,谢谢您。

      答:在《中国的语言》书里,有近百位我同事的名字。我可以提供他们的联系方式,但须得到其同意。

      问:您在1992年发表的论文中着重说明了语言辨别工作的重要性。这是否使得此后在中国探讨语言多样性的工作变得更为容易?使语言学家的工作更为容易?还是说,使该工作变得更难了?为什么?

相关文章: