中国不同族群对核心词认知的实验

作 者:

作者简介:
江荻,中国社会科学院研究员,博士生导师,主要从事汉藏语言学和计算语言学研究;尹巧云,中国社会科学院博士后,主要从事中国民族语言语音学实验研究(北京 100081)。

原文出处:
语言文字应用

内容提要:

本实验通过不同语言族群和不同词汇集,考察被试在不同条件下的图片命名反应时间,证明心理词库在语义、概念本体性质上不太可能是层级结构,认为任何具体词集(包括Swadesh词表)都是根据某种应用目的从心理词库整体词汇中抽取出来的,必然映射人类认知世界的文化、语用等层次性特征。本文结论对理解心理词库、Swadesh词表的深化应用和核心词的构建研究带来新的思路。


期刊代号:H1
分类名称:语言文字学
复印期号:2016 年 05 期

字号:

      一、缘起和目的

      近些年来,陈保亚(1996、1998、2006)利用Swadesh(1952、1955)两度研制的词表提出了一个同源词判定的阶曲线理论,走出一条完善历史比较法的新路子。由于该项研究或其他原因,人们把Swadesh制定的200词表和修订的100词表理解成两个等级,似乎词库的词汇是可以分层的。

      所谓词库,特指人类大脑(心理词库)存储词汇的空间和总藏。目前,心理学界对词汇存储和组织的方式虽然已经提出一些思路,但尚未取得决定性进展。另一方面,包括历史语言学在内的有关研究或多或少都涉及心理词汇的应用问题,诸如词汇形式、编码方式、词汇层级、词汇排序等等。历史语言学最关注的是词汇的演变和替代(汪维辉,2002),这就必然涉及词汇演变孰先孰后的顺序以及词汇在演变中的层级地位。演变和替代早的词跟晚的词在性质和特征上有哪些差别?这些差别只是不同应用角度呈现的,还是不同应用层面因素导致的?

      Swadesh并未有意区分词汇层级,但他的研究却留下了这样的遗产。我们简单观察一下Swadesh(1952、1955)词表产生的过程和后人分层的依据。Swadesh词表是为推算语言分化时间深度设计的,从多语言同源词历史保留的角度确定了严格的择词标准。在两次制表中,尽管Swadesh宣称新词表中没有一个词是因为在老词表中的稳定性百分比而被删除,但是,新词表基本还是由老词表精简而来,保留了92项,补充了8个新词项。在第二表的设计中,Swadesh就两个词表的年代学统计应用结果指出:“根据新词表计算出的同源词保留率比老词表的高。”正是这个原因,后人自觉或不自觉地对Swadesh词表加以分层(Campbell,1998),尽管这样的分层并没有词汇学上的理据。

      由于无法从词汇的本体性质或特征(概念、语义和形式等)上给词汇分层级,出现了借助应用层面语用要素的探索研究,例如词频特征(杨蓓,2003;江荻,2011)。可是词频特征局限性很大,在多数没有文字的语言中难以实施,对有文字的语言,其中的时代特征词、多形同义词等干扰因素也难以排除。

      汉藏语言的发生学研究很大程度上依赖同源词的判定,历史久远导致的语音差异和文化交融造成的借词都无法单纯借助比较法解决(陈保亚、汪锋,2006;汪锋、王士元,2006)。这也是人们把Swadesh词表称为核心词表的原因,期望通过词汇的分层来探索识别同源词的方法。我们相信,人们直觉上感觉到的个体词汇之间的差异必定会影响词汇的演变和替代,因此深入探索词汇的分层仍然是必要的。

      本研究受到心理语言学言语产生实验的启发(张积家、张凤玲,2010;张清芳、杨玉芳,2003;周晓林等,2001;庄捷、周晓林,2001),希望从一个不同的角度来讨论面向历史语言学的词汇分层问题。①目前,言语产生实验集中在说话产生过程,包括组织交流意图、激活概念、提取词义句法和语音信息,然后通过控制发音器官而发出话语声音。我们的实验虽然包含了言语产生过程,但重点关注输入变量和输出结果,涉及三类参项:第一是实验对象的语言身份性质,即母语族群或双语族群;第二是测试材料的分类,即主观上设置三组词项(包括Swadesh两次词表),希望从结果上观察是否存在词汇分级现象;第三是实验的反应时间。实验目的是通过记录不同语言族群对不同刺激的反应时来判断是否可以区分词汇层级,如果确有分层,是何种因素导致,这样的分层对词汇及其形式的历史比较和同源词判定是否有价值。另一方面,该项试验的结果对语言词汇教学和教材的设计、编写也具有参考作用。

      二、实验一

      实验一的目的是测试单语种被试命名图片的反应时间和对词汇的熟悉度。解答该问题有助于我们了解词汇是否存在认知上或语用上的层次差别。

      实验一的被试是中央民族大学预科教育学院的维吾尔族和哈萨克族学生,汉语水平处于起步阶段,日常生活中主要用母语交际。这些被试归为北单组(北方单语组)。另外选择部分不会其他语言的汉族学生,归为汉单组(汉语单语组)。这两组人数均为20人,共40人,年龄在18~22岁左右,均为智商正常的大学生。

      本实验从Swadesh第二次制定的100词表(陈保亚高阶词)中抽取部分词,配以图片,称为核心词。从第一次制定的词表减去第二次制定的词表剩余词(陈保亚低阶词)中抽取部分词,配以图片,作为次核心词。实验词汇所对应的图片主要来自中国常模图片库(舒华等,1989)。②操作上,我们把Swadesh词表与常模库配对,过滤掉不配对的,同时增加有图片但词表没有的词,这部分词作为实验参照组,称为非核心词。选择非核心词还采用了与Swadesh词项平衡配对的原则,例如家禽“鸡”对“狗”,数词“六、十、百”对“一、二、三”,颜色“蓝、灰、黄”对“黑、白、红”,自然现象“彩虹”对“雨”等,基本都是人们经验中常用性很高的词项。具体词表见附录。

      实验软件是委托中科院软件所自行开发的。采用VC2008集成环境开发,调用Microsoft Speak标准差K处理以声控方式与被试交互。软件未命名。实验时,软件从预先设定的图库中随机地无重复地选择一幅图片展示给被试,考察被试的反应时间。从图片出现在屏幕上开始计时,在听到被试的声音时自动记录下被试对该图片的反应时间。如果因为种种原因(如被试走神或受到干扰等),对某幅图片未能记录下合适的反应时间,则可以将本次对图片的实验设置为“作废”,软件将重新随机选择一张图片继续本次实验。为了让被试熟悉实验过程,软件还提供了“练习”的功能。在图片熟悉度实验部分,所用软件开发环境、实验的练习、过程、数据的收集等各方面与图片命名反应时间的实验都是一致的,不同的是,图片下方给出熟悉度的评判标准供被试选择。

相关文章: