字母词语跟踪研究

作 者:

作者简介:
郑泽芝,厦门大学中文系副教授,博士,硕士生导师,主要从事应用语言学、计算语言学研究(福建 厦门 361005)。

原文出处:
语言文字应用

内容提要:

基于对2002年(网络版)《人民日报》《北京青年报》《羊城晚报》全年一亿多字文本语料中字母词语的计算机辅助考察,文章首先从不同的角度对字母词语共时状态进行了客观描述;为了跟踪考察字母词语在汉语中发展变化的情况,我们选择了比较注重语言文字应用规范的全国性报纸《人民日报》,对其2002年、2005年、2006年(网络版)三年的文本语料进行了跟踪考察和量化分析;基于对大规模真实文本的考察结果,文章对汉语字母词语的使用范围、稳定性、用法等状况进行了探讨,并据此给出了对字母词语的一些思考和建议。


期刊代号:H1
分类名称:语言文字学
复印期号:2009 年 05 期

字号:

      零 引言

      字母在汉语中的使用,已经从表示序号、代号、编号,发展到字母词语在汉语中不断涌现。目前,这种语言现象在汉语中的使用范围如何,发展趋势如何,存在哪些问题,怎么对待等,都是有待探讨和解决的问题。本文以大规模真实文本的考察为基础,以量化数据为依据,对这种语言现象进行定性+定量的分析和讨论,希望对这些问题的解决有所裨益。

      报纸不仅是大众所广泛接受的文字媒体,而且在用词语的规范性上也比网络和口头媒体严谨,因此,本研究根据时间和经费等的可行性,首先,选择2002年三种主流报纸(网络版)《人民日报》《北京青年报》《羊城晚报》全年一亿多字的文本语料,进行了计算机辅助的拉网式考察,希望考察结果可以反映字母词语在汉语文本中使用的一个共时性轮廓。其次,选择比较注重语言文字应用规范的全国性报纸《人民日报》作为跟踪考察的对象,对其2002年、2005年、2006年(网络版)三年的文本语料进行了历时的考察分析,以考察字母词语的走势和稳定性。

      本文将从三个方面介绍我们对字母词语的跟踪研究:第一,基于2002年三种主流报纸媒体的考察结果,探讨字母词语在汉语文本中的共时使用情况;第二,基于我们对网络版《人民日报》2002、2005、2006三个年份的跟踪考察,探讨字母词语的历时演化情况;第三,以大规模真实文本字母词语考察结果为根据,探讨字母词语来源、用法等方面的问题,并据此给出我们对字母词语现象的一些思考和建议。

      一 字母词语的共时分布情况

      以下关于不同报纸媒体字母词语共时分布情况的描述源于我们对2002年(网络版)《人民日报》《北京青年报》《羊城晚报》三种主流报纸媒体中字母词语的考察结果。

      (一)2002年三种主流报纸中字母词语的总体使用情况

      表1 三种报纸字母词语的总体使用情况概括

      

      总体而言,表1说明字母词语的使用比例虽然不大,但从数量看还是比较明显的。其中《人民日报》字母词语的用量较少,《北京青年报》用量较大,《羊城晚报》居中,这种用量情况与报纸的特色基本相符。《人民日报》以国际国内的新闻和经济类文本为主要内容(约占66%),生活文化类占14%左右,设有教育科技栏目,没有广告版,用词语较规范,因此字母词语的用量相对较少;《北京青年报》新闻和经济类文本占总文本的不足36%,文化娱乐生活类文本的比例约占36%,另外专设有8版左右的广告,故字母词语使用较多;《羊城晚报》属于开放地区媒体,受港澳台影响较大,用词前卫,地方特色突出,如:阿B(Boss)、阿Sa(蔡卓妍的昵称)派、阿sir、阿Joe、阿明·M、阿KEN等,这些词语都是其他两种报纸所没有的。其国际国内新闻约占17%,经济类文本约占16.7%,内容上本地新闻约占33%,其他(多为地方内容)占33%多,地方内容合计占66%以上,生活娱乐文本较多,所以字母词语使用量居中。

      (二)字母词语共时分布中的一次性使用情况

      表2 2002年全年三种报纸字母词语一次性使用情况

      

      表2数据显示,字母词语的一次性使用率非常高,这种现象说明,字母词语在汉语中的使用临时性强,稳定性差。浏览三种媒体中一次性使用的字母词语,最明显的感觉是产品名称或代号、技术名称、公司名、品牌名、术语等特别多;而观察为数不多但使用频度高的字母词语,会发现它们大多与百姓日常生产生活相关性较高,如:CDP、NBA、CCTV、DVD、B超、MBA、T恤衫、G股……;另外根据我们对2005年《人民日报》字母词语的主题归类考察发现,名称、编码、术语、单位和标准5种用法的词语占了字母词语的90%以上;这种现象说明,大多数字母词语还是应用于行业、学科领域,能够被广泛使用的、与百姓生活密切相关的为数并不多。

      (三)三种报纸两两相交的情况

      表3 三种报纸两两相交情况

      

      从三种报纸的一次性出现和两两相交的结果看:字母词语在不同媒体、不同地区间的使用情况的差异性较明显。同为北京地区的《人民日报》和《北京青年报》交集词语数明显多于《人民日报》和《羊城晚报》的交集词语数,说明南北方用词用语有差异,事实也的确如此,如《羊城晚报》有“DVD光碟”而其他两种报纸只有“DVD光盘”;《北京青年报》和《羊城晚报》交集词语数明显高于它们分别与《人民日报》的交集词语数,这可以从两个方面解释,一是《人民日报》本身字母词语的用量较少,所以交集词语自然要少一些,二是从报纸自身特点而言,《北京青年报》和《羊城晚报》因为面向的人群不同,一个主要面向青年,一个处于沿海开放地区,用词用语上都具时尚性和放得开、新潮的特点,所以交集词语自然要多一些。

      (四)三种报纸共有字母词语情况

      表4 三种报纸交集字母词语(544种)在各报纸中所占比例的情况

      人民日报北京青年报羊城晚报

      10.71% 1.17% 5.14%

      从表4三种报纸交集字母词语所占比例看,各媒体共有字母词语只占字母词语大军的很少一部分,可以预见,能够进入汉语词汇系统被人们理解并使用的将更少。作者曾指导研究生就字母词语的使用情况在中学生、大学生、城乡居民中进行过调查,人们确实在用字母词语,但只有少数与人们生活密切相关的字母词语可以被理解和使用,大部分的字母词语都不为人知晓,被使用的则更少。

相关文章: