汉字问题的争论从上世纪初开始,一百多年来高潮迭起,一浪高过一浪。现在,又一个高潮随着全球信息时代的到来和中国先进文化建设的呼唤出现在我们面前,使我们一则以喜,一则以忧。喜的是,历史给了我们这一代人一个重新审视既往工作的机会,不但允许我们对汉字问题再一次进行全面的反思,而且,在反思之后,还有机会对既往工作的不足加以弥补和完善。这是汉字的幸运,也是中国文化的幸运。忧的是,先辈们将近100年的苦苦思索和奋力拼搏,许多人为之付出巨大的代价,并没有把汉字问题处理得十分恰当。现在,在一个崭新时代更为复杂的现实面前,要求又这样紧迫,我们能正确把握汉字的现在和未来吗?鉴于语言文字在多方面的重要作用,国家已经颁布了通用语言文字法,规范汉字成为法律规定的使用文字。但是,规范汉字究竟指的是什么,还没有一个十分明确的内涵。规范是一个一旦提出便一泻千里的大冲击波,一管就是几十年。在我们用国家法律职能规定全国人能写什么字不能写什么字的时候,一旦有了失误,不但会影响全国甚至是全世界人在汉语领域的语文生活,还会影响中国文化发展的速度和质量,这难道不令我们有所忧惧吗? 一、深入的反思是绝对必要的 喜也罢,忧也罢,深入的反思都是必要的。历史的经验值得注意,而前代的经验未必都适用于当代。认真总结一个世纪实际工作多方面的经验,我们应当能够以高度的责任感,慎重而又慎重地完成这个历史使命。也许,现实的条件会否定理想,但我们不应当放弃理想。理想的汉字规范应当考虑汉字的科学性和社会性。科学性指的是汉字的自然规律,包括它的结构规律、演变规律、互相关联的规律和自成系统的规律,这种内在的规律是客观的。社会性指的是汉字在使用时受社会制约的人文性,语言文字是符号,但不是单纯的数理符号,它是在人文社会中被全民使用着也改变着的符号。汉字的通行度、社会性分布和人为调整的可能性,都是它的社会性的反映。科学性与社会性二者是互相制约的——汉字客观规律的形成与它的社会背景有密切的关系;而社会对汉字的人为调节,无论如何不能违背它自身的规律。我们应当用这个标准来衡量一个世纪以来汉字规范的实践。 半个世纪以来,人们心目中的规范汉字,大约是以下几个文件所限定的汉字:1964年公布的《简化汉字总表》所规定的简化字(1986年国家语委重新发表《简化汉字总表》时作了某些调整),1955年12月文化部和中国文字改革委员会联合公布的《第一批异体字整理表》中的正字(1956年2月1日正式实施),1965年1月公布的《印刷通用汉字字形表》中规定的印刷宋体字形。1988年3月25日,国家语委和国家新闻出版总署联合公布的《现代汉语通用字表》,综合了前三项字表的规定,算是对20世纪80年代以前关于汉字规范的一个总结。这些已经公布的字表,有关于正字字样(注:结构和写法完全相同的汉字,归纳为一个字样。汉字规范的做法是在记词功能完全相同的诸多异构、异写字样中,选择一个作为正字——也就是规范字。)的规定,有关于字形的规定,有关于字数的规定,该规定的都规定了。这些规定虽然并不都是国家最高权力机构发布的,但是在实际上,它们已是群众公认的规范标准,在现代语文生活中取得了应有的规范地位,我们是否可以就延续这些已有的规定来确立现行的规范汉字呢? 应当看到,上述文件发布的时间,距离现代多则达到半个世纪,少的也已经将近20年了。在这漫长的岁月里,中国社会发生了极大的变化,制定这些规范的理念——也就是主导思想——本来是适应当时情况的,而现在,有些已经不适应了。而且,语言是随着社会的发展而发展的,文字是记录语言的符号系统,半个世纪以来,语言的变化已经相当显著,规范也是需要与时俱进的。何况,经过如此长时间、大规模的实践,其中不够完善的地方也都显现出来。近20年来,语言文字学术界对这些规范的科学性提出过许多中肯的意见,广大使用者则对这些规范的实用性提出过许多疑问和改进的要求,如果我们对这些置若罔闻、坚持不改,不但会影响群众对政府管理部门的信任,而且也会影响先进文化的建设和信息时代的工作效率。还有一点也是我们不能忽略的:在汉语借助汉字进入计算机的信息时代,以前的规范已经不够用了,许多新的规范必须制订也正在制订,例如,信息处理用的汉字部件规范已经制定,基础教学用的部件规范正在制订,笔顺规范、部首规范等也已经有了初步的成果,……规范汉字是制订其他语言文字规范的基础,这些年来,每制订一个新的规范或标准,都会面临上述那些文件不完善的地方。如果我们不尽快调整这些已有的字表,本来为数不多的小疵随着新规范的不断出台累积增厚,就会越来越干扰使用。所以,在新形势面前,重新来审视既往的工作,制订一个新的规范字表,已经是刻不容缓的事了。 二、关于常用字和通用字字表 1988年3月25日国家语委和国家新闻出版总署联合公布的《现代汉语通用字表》,实际上包含三个级层——2500多个常用字,1000多个次常用字,以及包含前两个级层在内的7000多个通用字。这个字表是以汉字在现代的使用频度为主要依据来制定的。但是,人们在使用中发现,还有一些经常使用的汉字没有进入这个字表,于是,在汉字输出过程中,新造字变成一个不可缺少的程序;而字表中的有些字,几乎要被人遗忘,因为它们实在没有通用价值,仅被偶尔使用,甚至一般新闻、书刊完全不用。在通用字表里,有一部分字只供人名、地名使用,但字表又不能涵盖整个人地名用字。造成这些问题的原因不外两个方面:一是字表没有随着语言文字社会使用的发展而及时调整和变化,二是当时频度统计的语料选择和统计的方法还不够完善。这里重点谈一谈通用字数据统计的问题。 《现代汉语通用字数据统计表说明》(注:这里引用的《现代汉语通用字数据统计表说明》,均根据国家语委汉字处编《现代汉语通用字表》所附的《现代汉语通用字数据统计》(语文出版社1998年第二次印刷),为了方便一般读者阅读,其中的数学统计公式不再引用,只阐明其主要精神,如有误解,由我本人负责。)说: