汉语新词与流行语的采录和界定

作 者:

作者简介:
邹嘉彦,香港城市大学语言资讯科学研究中心教授; 游汝杰,复旦大学中文系教授,博士生导师。(上海 200433)

原文出处:
语言研究

内容提要:

新词和流行语是语言研究的一个热点。新词的采录和界定,应该以具有连续性和惯常性的语料库作基础,因为它具有时间、空间、频量的依据,可大大提高研究成果的科学性和准确性。采录新词时,则应注意其地区性、时间性、广用性、频用性和稳定性,尤其是地区词、流行语、网络用语、字母词等,须在客观原则下经细心甄选和鉴定,才能赋予现代汉语新词语的资格,使其不与“新词语”相混淆。


期刊代号:H1
分类名称:语言文字学
复印期号:2008 年 07 期

关 键 词:

字号:

      近年来汉语新词研究已成热点课题,并已出版多种新词词典,如《新华新词语词典》[1]、《新词语大词典》[2]、《21世纪华语新词语词典》[3]。同时,怎样界定新词、采录新词?如何研究新词?如何看待新词?也成为学界、媒体甚至社会大众关注的论题。本文拟就新近在《中国语言生活状况报告(2006)》中公布的《2006年汉语年度新词语》和笔者所编《21世纪华语新词语词典》[4,5],探讨这些问题。

      一 语料库、新词的源流和采录的科学性

      研究词汇与研究语音、语法有所不同。一种语言中的语音或语法系统是封闭性的,找一个合适的发音合作人(informant),来提供语音和语法资料,如果问题表(questionnaire)或调查项目得当,所得的资料可能有较高的代表性。但是词汇是开放性的,难以穷尽的,词汇牵涉社会生活可以说是全方位的。从个人或少数人收集的语料,其代表性令人怀疑。尤其在社会变革剧烈的年代和不同文化频繁接触的时代,更是如此。词汇变化本来就比语音和语法快,在这样的时代变化更快。如果研究者采用自身反省、推理的方法来探讨一个语言现象,难免有遗漏。以个人或少数人的语料为依据,可靠性不够。如果采用随机抽样的实地调查方法,简单地把结论延伸到整体,也往往缺少说服力。不过,如果我们把焦点放宽,以具有代表性的平面媒体作为一个群体,并以它的语言现象的总和作对象,就会使结论较为可信。现代信息科学为社会语言学研究提供了更为有利的、方便的条件,使我们有可能处理大量的群体语言资料,也可以有计划地按照自己的意图去抽样。

      可以用于比较研究的语言资料,新闻报章是相当合适的,尤其是那些在当地有代表性的受欢迎的综合性报章,它们能最直接、最迅速地用书面语言传送现实社会及大众所关注的信息。也正是由于这个原因,这些报章文字也最能反映其时其地读者所处的社会及其所使用的语言,即能全方位反映时代面貌和当前的社会生活。大众媒体的长期过滤,对新词能否存活,也是很好的考验。

      基于上述认识,香港城市大学语言资讯科学研究中心于1994年建立了《各地中文共时语料库》(LIVAC:A Synchronic Corpus of Linguistic Variation in Chinese Communities),已有10多年的历史。每隔数天定时、定点、定版(范围)、定量采录一次香港、北京、上海、深圳、台北、澳门和新加坡七地主要报刊的语料。内容包括社论、第一版的全部内容、国际和地方版的主要内容、文娱、体育、经济新闻以及一些特写和评论。至今储存的语料已有经机器分析和人工处理的2亿多字、内部词库1百多万词条,可供上网初步检索,也可用作多方面研究与开发IT的基础。请参阅我们的网址:http//www.livac.org[6]。这样的语料库具有连续性和惯常性的特点,最适合收录和研究新词。

      这个语料库有3个基本分库:新词词库、复合词(短语)库和一般词库。

      有了这样的语料库,就可以就不同的专题,选取相应的资料,把它们展现在同等的“视窗”内。“视窗”式的社会语言学研究方法是我们首倡的,并付诸实施,结果十分理想。我们采用定时间定地点的“视窗”式抽取语料的方法,把同一个镜头对准同一时限各群体的语言现象,获得较为全面的文字资料及丰富的词例,据此进行全面的统计分析。有了视窗式的研究方法,既可以在同等可靠的客观条件下观察到同一时期不同地方的群体语言使用情况,又可以观察到同一地方不同时间的群体语言使用情况。通过视窗来搜集和观察语料可以避免研究工作的盲目性、随意性和收录者个人的任意性,并且可以实现定量、定性、定点研究。通过这种比较科学地采录样本的方法,大大提高新词收录的科学性。正如研究鱼类的分布,就要在同样的地方、同样的时间,用同样的方法来观察鱼的种类、数量等。要收集雨量与雨水的质素,就要做到定点定时定性。例如在北美洲北部区域,有一种蝉的生命周期为17年,被称为“17年蝉”(17-Year Cicada),如果科学家的研究年限少于17年,就不可能知道这种蝉的生命周期了。

      新出现的词汇是否入选,作为有资格“新词”,一个重要的依据即是是否已达到一定的使用频率。而语料库是频率统计的最好帮手。主要根据频率的多寡,可以把新出现的词汇分成四类:常用新词、准常用新词、准边缘新词、边缘新词。以香港为例,从1997年至今,10年以来产生的新词汇就可以分为以下四类:

      (一)常用词

      使用频率已稳定,并成为香港常用词语,如“归属感”和“黄金周”。

      1 归属感

      指一个人对某一事物的从属感觉。香港自回归以后,很多人都谈论港人对国家的认同,如究竟视自己为“中国人”还是“香港人”;对国家的感情又有多少等。有人也称为“认同感”。

      2 黄金周

      2000年开始,内地统一调整春节、劳动节和国庆节的三个假期,把前后的两个周末和法定的三天假期集中,形成连续七天的假期。目的是推动假日经济,鼓励市民消费。由于商家能够从中制造赚钱商机,因此称为“黄金周”。黄金周吸引很多内地游客趁着黄金周到香港旅游,而有利于香港经济。

      

      表1 归属感

      

相关文章: