[中图分类号]H08 [文献标识码]A [文章编号]1003-7365(2003)03-0001-10 跨入二十一世纪,面临知识经济社会。随着知识爆炸式增长,人类面对许多“新词”,电脑也将面对许多“未登录词”。尽管“新词”激增,但“汉字”数量却未增。《现代汉语词典》(2002增补本)后面水红色纸增补了1200条“新词”,而前面白色纸的正文却一个“单字条目”也未增。这证明了:汉族人既有用旧字造新词的创造力,又有看旧字懂新词的领悟力。 我国人工智能学者和语言学者要通力合作,让电脑模拟汉族人看旧字懂新词的智力。这就应促使“汉语基因工程”上马,即把字符当作汉语的“基因”,构建各级“意序模式库”,阐明造字、造词和造句的“意合规则”。这有助于电脑的知识处理,有助于对外汉语教学,要教外国学生也像汉族人一样,有看旧字懂新词的领悟力和把新知识“意译”为汉语时有用旧字造新词的创造力。 我国台湾学者朱邦复先生在“汉字基因工程”方面已经先行一步。韩英铎院士1999年在《计算机世界》上发表了《汉字基因论及在信息时代将引发的革命》。大陆的学者要迎头赶上。 笔者所主持的“国家语言文字应用‘十五’科研项目”是在进行初步的探索,也是为大规模的“汉语基因工程”的上马做前期准备或小规模演习。祈望得到语言学家的指教。 一、生物遗传基因研究对语言研究的启示 1.1 上世纪和本世纪之交最大的科技突破是“人类基因图谱”的测序。突破点是“基因”,突破方法是用信息观点和信息技术来测定基因的“排序”。生物学家在研究基因编码时查明:不同的DNA的差异在于所含的四种碱基(A,C,G,T)有不同的“排序”。运用信息技术可以测定全部“基因”的排序。生物遗传基因研究对语言研究的启示主要有两点:一是要探索并确定语言的“基因单位”;二是要探索并构建由基因单位层层组成较大语言单位的“意序模式”。 1.2 生理遗传的“基因”和人文遗传的“敏因”。 布莱克茉尔(S.Blackmore)在The Meme Machine中提出:人类既有生理遗传gene(基因),又有人文遗传meme。戴浩一(2002)在《概念结构与非自主性语法:汉语语法概念系统初探》中指出:人类的语言既受生理遗传gene的影响,也受人文遗传meme的影响。戴先生这篇用中文在《当代语言学》发表的论文中未给出meme的中文译名,我们建议把meme译为“敏因”。因为meme既然是“人文的、智力的、历史的”、遗传的“因”,跟“基因”相提并论,就应该译为“□因”。考虑到“敏”字有一个义项是“敏慧”(聪明智慧),并且“敏”字有三个部件:左上角和右偏旁的“
攵”理解为“人文”,左下角的“母”理解为是由“父母”遗传的。所以,“敏因”意为“父母遗传的人文基因”。不知这样翻译是否合适,敬请专家指正。 本文认为,汉族人有用旧字造新词和看旧字懂新词的能力,一方面有后天环境中“习得”的原因,另一方面也有天生的人文遗传“敏因”(meme)的作用。是否如此,还有待证明。 二、汉语是汉族人对知识的编码系统 2.1 人类通过感觉器官(眼睛、耳朵等)和知觉器官(大脑),对“客观世界”的信息进行接收和加工,在大脑中形成了“认知世界”即有了“知识”。要使知识能“储存”和“传播”,需要对知识进行“编码”,即把知识编成一套符号系统。汉语是汉族人对知识的编码系统,它体现了跟汉族人认知模式侧重于“整体感知、意象思维、类比推理”的特点密切相关的编码机制。 徐通锵先生在《语言论》中指出:汉语社团的思维方式集中表现为“比类取象”和“援物比类”。汉语的编码机制一开始就偏重于符号的音义结合的理据性。向徐先生当面请教之后,我们认识到,汉语的语言编码机制可以表述为:援物、取象、谐声、对偶、比类、意合、简约。 “援物”是以客观物质世界为临摹的依据,在约定性之中尽量体现汉语的“理据性”。 “取象”是临摹客观的物体形象和事件序象,并加以符号化来体现汉语的“象似性”。 “谐声”是在视觉符号记事的基础上提高其示音性,在韵律上体现汉语的“和谐性”。 “对偶”是单音节规整、双音节稳定、排句谋篇讲对称,以之体现汉语的“齐整性”。 “比类”是造字构词时按意分类、按类联想,在知识的聚合上体现汉语的“系统性”。 “意合”是造句时只求意义合理、略于形态,在知识的组合上体现汉语的“朴实性”。 “简约”是利用语境条件,在明确的前提之下力求语言简洁以体现汉语的“经济性”。 2.2 汉语的基本结构单位是“字”(gram)。 2.2.1 索绪尔指出,人类只有两种文字的体系:表意体系和表音体系。他说:“表意体系是一个词只用一个符号表示,而这个符号却与词赖以构成的声音无关。这个符合和整个的词发生关系,因此也就间接地和它所表达的观念发生关系,这种体系的古典例子就是汉字。”(参见《普通语言学教程》50页,商务印书馆1982年版,下划线为笔者所加。) 由于认知模式侧重“整体感知”,汉族人对语音的敏感单位是“音节”。汉族的初民用一个音节表示一个概念,使古汉语成为“单音节语言”(monosyllabic)。 汉语音节的边界分明,一个音节就是语音流中的一个“响度峰”。