谈《规范汉字表》的制定与应用

作 者:
王宁 

作者简介:
王宁,北京师范大学民俗典籍文字研究中心教授,博导。(北京 100875)

原文出处:
语言文字应用

内容提要:

本文阐释了新的《规范汉字表》制定中的一些原则问题。文章认为,信息时代是汉字规范必要性更加突显的时代。汉字进入计算机,信息传播实现了高速度、远距离和高度社会化,给汉字规范提供了新的思路:首先是规范字的数量要有所增加;其次是规范的实施强度和宽松度要有所中和;再次是对《规范汉字表》的应用既要“不离不弃”,又要“各取所需”。这样才能既有利于信息时代政治、经济、文化的发展,又能有利于构建全社会和谐的语文生活。


期刊代号:H1
分类名称:语言文字学
复印期号:2008 年 09 期

关 键 词:

字号:

      一、信息时代是汉字规范的必要性更加突显的时代

      我国现代汉字规范工作酝酿于20世纪初期。新中国成立后,由于一些领导人的提倡,这项事业由学术层面转为国家行为,20世纪50年代以来的汉字规范政策,重要的是由国务院直接发布的,一般的或补充性质的,也是在国务院批转的情况下,由文化、教育、出版或语言文字主管部门单独或联合发布的。这些文件的发布和半个世纪的贯彻实践,为我国人民的语言文字生活注入了新的内容,形成了全国人民尤其是语言文字工作者牢不可破的规范意识和遵循规范的用字习惯,减少了各个领域使用汉字的难度,对文化、教育、出版和科技的发展,起到了无形的重要推动作用。试想一下,在幅员辽阔、人口众多的中国,政治经济如此统一的情况下,如果没有通用层面的汉字规范,仅仅是国家政令和基础教育这两项,书写不一的汉字将要带给人们多少麻烦,就可以知道“规范”二字具有多大的分量了!

      1979年以来,国家改革开放,国情发生了巨大变化,中国正在实施的创新型国家的伟大战略中,信息化成为实现这一目标的重要支撑。有人说:“现在的文字已经很少手写,计算机的贮存空间又这样大,规范的必要性已经逐渐减退了。”这种想法只是从个人使用汉字的角度看问题,是不符合实际的。在信息时代,发展政治、经济、文化的重要条件,是及时和准确地获得必要的信息,并把需要传播出去的信息及时和准确地传播出去。计算机成为传播信息的工具,实现了信息传播的高速度、远距离和高度的社会化。由于信息的远距离传播,输出者与接受者是两头不见面的;在重大问题上,信息传播的两端已经不是一人对一人,而是一国对另一国、一个群体对另一个群体,信息的社会性得到了充分的体现。在这种情况下,汉字规范的作用就更加突显出来,可以说,有了汉字这种传播载体的标准化,才能实现信息传播的速度和信度。

      二、必须增加规范汉字的字量

      信息化时代汉字规范的一个突出特点是规范汉字的数量需要作一定的补充。从数量统计的角度,常用汉字和通用汉字的数量,不论在什么时代,都保持在3000~7000这个数量范围内。但是,完全从使用频率和语料覆盖率的角度来搜集用字,难以搜集到一些特殊领域的用字。这些特殊领域,在汉字主要是手写的时代,即使不立标准也不会有太大的问题,而在计算机和互联网时代,那些在一般语料库里凭借字频难以找到的字,在人民的日常生活中却不失其通用性:

      科技用字。由于科学技术的发展和教育水平的提高,很多科学技术的用语快速进入人们的日常生活。仅仅拿记录化学元素符号的汉字来说,它们很多要用在药品名上,当药方不再手写而用计算机输录时,这些字就不断地出现在病人的手上。农药、化肥、室内装修材料也有不少是要用它们的学名来宣传、普及的。至于化妆品、清洁剂的使用,饮食健康的讲解,气象的采集和预报等等,一旦进入科学普及领域和基础教育的教科书,都会受到普遍关注。

      地名用字。地名用字的使用范围往往不是全国所有地区通行的,但却属于当地居民的常用字,乡以上地名用字又是各省(市、区)不可缺少的。过去,由于民族和方言发音的分歧,经常会产生一些任意造的转语字(即当地人根据方音自造的形声字),造成用字的混乱。在户籍、邮政、信贷、金融等行业的信息贮存和检索已经数字化了的今天,地名用字的混乱会给有关行业带来哪些后果,是不言自明的。

      姓氏人名用字。中国是一个多民族的国家,姓氏不但记录着民族和血缘关系,还成为每个公民的称谓符号。这些姓氏数量有限,但是必须正确使用,才能保证信息的信度。至于名字所用的汉字,现在已经相当混乱,有些名字的用字甚至在已经扩充到7万余字的国际编码中都难以找到,致使第二代身份证的制作由于姓名用字不全产生很大的困难。新的《规范汉字表》无法改变过去的那种姓名用字混乱的事实,但是可以学习一些先行国家的经验,对以后新生儿起名字作一些限定。这就需要尽量将姓氏用字收全,并在已有的人名用字中选择足够的、适合于起名字的汉字进行规范,以保证个人姓名在社会上的有效流通。

      基础教育文言用字。规范汉字主要是书写现代汉语文本的,但是,传统与历史和现代不是绝缘的,现代文本中会引用文言作品,中小学语文教材中也都会收一部分优秀的文言作品。前者可以在一般的平衡语料库中收集到,而为了保证教材印刷的规范,需要在语文教材中专门收集文言文的用字。

      以上四个方面,既然已经进入通用层面,为什么又不能在平衡语料库里依照字频和覆盖率收集到呢?这个问题需要从两个方面解释:第一,需要全面理解“通用”这个概念。通用包括两个侧面:一个是书写的侧面,一个是阅读的侧面。能够进入平衡语料库的汉字,兼有这两个方面的通行度;但是也有一些汉字,书写的频度并不高而阅读的频度却很高。例如,前面说到的西医药名、饮食营养学中的化学元素用字,有一些不在社会通用范围内,因为文本的使用率并不高;但阅读的几率却可以达到千家万户。又如,基础教育语文教材的文言用字,也有少部分不属于社会通用字,但是每年的教材印刷必须使用,历届老师、学生、家长必须面对,也是需要统一字形而进入规范的。第二,以汉字为载体的信息,一部分是在流通领域通行的,还有一部分是储备领域必需的。例如姓名,除了知名人士,一般的姓名在社会通用层面上使用度不会太高;地名,除了大城市、著名景点,一般的地名在社会通用层面上使用度也比较有限,根据字频和使用度不能将它们收集出来。但是,无所不往的邮政、金融、交通等事业,无人不用的身份证、户籍卡、学历证书、病历卡等证件,必须储备可能用到的汉字。如果在信息处理上不去对这些字进行规范,也会引起社会信息储备和使用的混乱。

相关文章: