新世纪是知识经济的时代,知识经济时代最重要的就是知识。语言是知识的编码系统,知识的表达、贮存、传承、创新都要通过语言来实现。因而,语言将受到多学科专家的高度重视并将得到全方位的深入研究,于是,将“认知语言学”、“对比语言学”、“计算语言学”这三门学科融为一体的交叉科学“信息语言学”(informatic linguistics)就应运而生了。 “信息语言学”研究人脑语言信息处理机制和电脑语言信息处理机制的共通性和特殊性,也研究在不同民族文化影响下的不同民族的语言信息处理机制的共通规律和特殊规律。 21世纪也将是生物科学取得更大突破的世纪。生物科学所选择的突破点是“基因”,突破方法是用信息的观点和方法来研究基因的“排序”。生物学家在研究基因编码机制时查明:不同的DNA 的差异在于所含的四种碱基(A、C、G、T)有不同的“排序”。运用先进的信息技术可全面测定“基因”的排序。与这种突破相适应,诞生了新兴的“信息生物学”。 “信息生物学”在突破点的选择和研究的方法上对“信息语言学”有两点非常有价值的启示:(1)要寻找“基元单位”(genetic unit);(2)要在较大的组合中探索基元单位的“排序”。 在“信息生物学”的启发下,“信息语言学”确立了研究汉语的两个要点:(1)要寻找汉语的最小的有意义的“语言单位”, 简称“语位”(grammeme)。(2)要构建汉语各层次组合的“有序模式”,即“意合模式”(semotactic frames)。 一 汉语的基元单位是“语位” 汉族人的听觉敏感单位是“音节”,所以汉语的基元单位应该定位在“单音节”上;汉语具有“以字形提示意义”的功能,所以汉语的基元单位要考虑“视觉形象”;汉字往往有多个“义项”,所以汉语的基元单位应该定位在“汉字的一个义项”上。
西方语言学家普遍认为,文字仅仅是记录第一套符号(语音符号)的第二套符号。对于西方语言来说,文字的唯一功能就是记录语音,所以是“符号的符号”。但对汉语来说,文字最初的功能是“援物、取象、比类、尽意”,正如《周易》所说的:“立象以尽意”。汉族初民在“结绳记事”的基础上也逐步从“画图记事”发展为“字符记事”。这些能“记事”的字符进一步抽象化和符号化,就渐渐演变为也能同时“提示语音”的示音记事文字。 英语反映“客观世界”,单线发展,一脉相承,“语音符号”和“文字符号”是串行的。 客观世界的“鱼”→语音符号[fi∫]→文字符号fish 汉语反映“客观世界”,双管齐下,最后汇合。“语音符号”和“文字符号”是并行的。
索绪尔在《普通语言学教程》里说:“对汉人来说,表意字和口说的词都是观念的符号;在他们看来,文字就是第二语言。”他还说:“书写的词常跟它所表现的口说的词紧密地混在一起,结果篡夺了主要的作用;人们终于把声音符号的代表看得和这符号本身一样重要或比它更加重要。” 从这一特点出发,应加强对汉语“视觉单位(形位)”的研究,特别是在网络时代更应如此。 (一)声位(单音节) 1.不同的民族有不同的语音敏感单位。人类生活在同一个地球上,各民族的“认知模式”具有很大的共通性。而各民族有不同的生活地域和人文环境,所以,各民族的认知模式也有一定的独特性。正由于这种“大同”之中的“小异”,使不同的民族在语言单位的“敏感性”和“概括性”方面表现出明显的差异。如爱斯基摩人因长年生活在冰天雪地的环境中,他们的民族语言中就有较多的分辨冰雪颜色的词语,这些词语对于热带的民族来说,是难以理解的。 汉族人在认知模式上侧重于“整体感知、综合思维”。这从中医跟西医的区别上看得很清楚。在对语音单位感知的灵敏性上,汉语跟英语也不同。 西方人在认知模式上侧重于“细部感知、分析思维”。英语语音敏感单位是音位。英语的音节中有辅音连缀,如lift,list,lisp。英语音节的特点是: (1)音节的边界不清,要求连读,如look out中的k和ou要求连读如“靠”; (2)短元音和闭音节占多数,长元音和开音节占少数, 因而不宜延长,也不够响亮; (3)因为有辅音连缀,如grasp,splint等,所以英语音节的类型是无限的。 汉族人的语音敏感单位是“音节”。现代汉语中不存在“辅音连缀”,ch、sh、ng都是“单辅音”。汉语音节的特点是: (1)音节边界分明,不能连读。如“西安(xī’ān)”不能读为“鲜(xiān)”; (2)绝大多数音节是元音结尾的“开音节”,声音响亮, 适于延长; (3)一个音节最多四个音位,类型有限,只有24 种类型(见下文);