汉语的根字和字族

——面向知识处理的汉语基因工程

作 者:
鲁川 

作者简介:
鲁川 男,1961年毕业于哈尔滨工业大学计算机系,现为教育部语用所研究员,中国应用语言学会理事。教育部 语言文字应用研究所,北京 100010

原文出处:
汉语学习

内容提要:

本文假设汉族人的头脑中有“知识聚合网络”PNK,此网络的每个“节点”储存一个汉字。只要用一条“有向弧”连接两个“节点”就形成了汉语的一个“双字词”。当表示新知识的新词出现时,汉族人的PNK无须增补网络的“节点”而只须增补连接原有节点的“有向弧”就行了。文章介绍了面向知识处理的汉语基因工程的详细内容,也讨论了汉语的五百个“根字”及其“字族”。


期刊代号:H1
分类名称:语言文字学
复印期号:2003 年 09 期

字号:

      [中图分类号]H08 [文献标识码]A [文章编号]1003-7365(2003)03-0001-10

      跨入二十一世纪,面临知识经济社会。随着知识爆炸式增长,人类面对许多“新词”,电脑也将面对许多“未登录词”。尽管“新词”激增,但“汉字”数量却未增。《现代汉语词典》(2002增补本)后面水红色纸增补了1200条“新词”,而前面白色纸的正文却一个“单字条目”也未增。这证明了:汉族人既有用旧字造新词的创造力,又有看旧字懂新词的领悟力。

      我国人工智能学者和语言学者要通力合作,让电脑模拟汉族人看旧字懂新词的智力。这就应促使“汉语基因工程”上马,即把字符当作汉语的“基因”,构建各级“意序模式库”,阐明造字、造词和造句的“意合规则”。这有助于电脑的知识处理,有助于对外汉语教学,要教外国学生也像汉族人一样,有看旧字懂新词的领悟力和把新知识“意译”为汉语时有用旧字造新词的创造力。

      我国台湾学者朱邦复先生在“汉字基因工程”方面已经先行一步。韩英铎院士1999年在《计算机世界》上发表了《汉字基因论及在信息时代将引发的革命》。大陆的学者要迎头赶上。

      笔者所主持的“国家语言文字应用‘十五’科研项目”是在进行初步的探索,也是为大规模的“汉语基因工程”的上马做前期准备或小规模演习。祈望得到语言学家的指教。

      一、生物遗传基因研究对语言研究的启示

      1.1 上世纪和本世纪之交最大的科技突破是“人类基因图谱”的测序。突破点是“基因”,突破方法是用信息观点和信息技术来测定基因的“排序”。生物学家在研究基因编码时查明:不同的DNA的差异在于所含的四种碱基(A,C,G,T)有不同的“排序”。运用信息技术可以测定全部“基因”的排序。生物遗传基因研究对语言研究的启示主要有两点:一是要探索并确定语言的“基因单位”;二是要探索并构建由基因单位层层组成较大语言单位的“意序模式”。

      1.2 生理遗传的“基因”和人文遗传的“敏因”。

      布莱克茉尔(S.Blackmore)在The Meme Machine中提出:人类既有生理遗传gene(基因),又有人文遗传meme。戴浩一(2002)在《概念结构与非自主性语法:汉语语法概念系统初探》中指出:人类的语言既受生理遗传gene的影响,也受人文遗传meme的影响。戴先生这篇用中文在《当代语言学》发表的论文中未给出meme的中文译名,我们建议把meme译为“敏因”。因为meme既然是“人文的、智力的、历史的”、遗传的“因”,跟“基因”相提并论,就应该译为“□因”。考虑到“敏”字有一个义项是“敏慧”(聪明智慧),并且“敏”字有三个部件:左上角和右偏旁的“攵”理解为“人文”,左下角的“母”理解为是由“父母”遗传的。所以,“敏因”意为“父母遗传的人文基因”。不知这样翻译是否合适,敬请专家指正。

      本文认为,汉族人有用旧字造新词和看旧字懂新词的能力,一方面有后天环境中“习得”的原因,另一方面也有天生的人文遗传“敏因”(meme)的作用。是否如此,还有待证明。

      二、汉语是汉族人对知识的编码系统

      2.1 人类通过感觉器官(眼睛、耳朵等)和知觉器官(大脑),对“客观世界”的信息进行接收和加工,在大脑中形成了“认知世界”即有了“知识”。要使知识能“储存”和“传播”,需要对知识进行“编码”,即把知识编成一套符号系统。汉语是汉族人对知识的编码系统,它体现了跟汉族人认知模式侧重于“整体感知、意象思维、类比推理”的特点密切相关的编码机制。

      徐通锵先生在《语言论》中指出:汉语社团的思维方式集中表现为“比类取象”和“援物比类”。汉语的编码机制一开始就偏重于符号的音义结合的理据性。向徐先生当面请教之后,我们认识到,汉语的语言编码机制可以表述为:援物、取象、谐声、对偶、比类、意合、简约。

      “援物”是以客观物质世界为临摹的依据,在约定性之中尽量体现汉语的“理据性”。

      “取象”是临摹客观的物体形象和事件序象,并加以符号化来体现汉语的“象似性”。

      “谐声”是在视觉符号记事的基础上提高其示音性,在韵律上体现汉语的“和谐性”。

      “对偶”是单音节规整、双音节稳定、排句谋篇讲对称,以之体现汉语的“齐整性”。

      “比类”是造字构词时按意分类、按类联想,在知识的聚合上体现汉语的“系统性”。

      “意合”是造句时只求意义合理、略于形态,在知识的组合上体现汉语的“朴实性”。

      “简约”是利用语境条件,在明确的前提之下力求语言简洁以体现汉语的“经济性”。

      2.2 汉语的基本结构单位是“字”(gram)。

      2.2.1 索绪尔指出,人类只有两种文字的体系:表意体系和表音体系。他说:“表意体系是一个词只用一个符号表示,而这个符号却与词赖以构成的声音无关。这个符合和整个的词发生关系,因此也就间接地和它所表达的观念发生关系,这种体系的古典例子就是汉字。”(参见《普通语言学教程》50页,商务印书馆1982年版,下划线为笔者所加。)

      由于认知模式侧重“整体感知”,汉族人对语音的敏感单位是“音节”。汉族的初民用一个音节表示一个概念,使古汉语成为“单音节语言”(monosyllabic)。

      汉语音节的边界分明,一个音节就是语音流中的一个“响度峰”。

      

相关文章: