汉字系统优化是指汉字系统通过自身调节和人工干预,使其内部结构及外部效用都达到最佳状态。依靠自身调节的优化称作自然优化,依靠人工干预的优化称作整理优化。本文所讨论的汉字系统优化专指整理优化。 对汉字系统进行整理优化由来已久,从秦始皇的“书同文”到汉代的《熹平石经》,再到唐代的字样学,都对汉字的发展产生了重要影响。进入近现代以来,出于政治文化变革的需要,社会上掀起了一场以拼音化为终极目标的汉字改革运动,针对汉字难学、难记、难写、难读的缺点提出了一系列调整方案。新中国成立以来,这项工作得到了延续,并受到政府的高度重视,于1954年专门成立中国文字改革委员会,确定了当时文字改革的三大任务:简化和整理汉字,推广普通话,制订和推行汉语拼音方案。在汉字简化和整理工作方面与文化部联合发布《第一批异体字整理表》(1955年),公布《汉字简化方案》(1956年),编制《简化字总表》(1964年),更改了35个较为繁难的地名用字(1964年),又与文化部联合发布《印刷通用汉字字形表》(1964年)。1985年中国文字改革委员会更名为国家语言文字工作委员会,于1986年修订并重新发表《简化字总表》,于1988年相继发布《现代汉语常用字表》《现代汉语通用字表》。此外,中国文字改革委员会还编印了《第二批异体字整理表(初稿)》(1956年)、《异体字整理表(修订稿)》(1965年)、《第二批异体字整理表(征求意见稿)》(1976年),发布了《第二次汉字简化方案(草案)》(1977年)。后几个字表由于社会环境及字表自身的原因,有的未能正式发布实施,有的发布后又宣布废止。从已经正式实施的几个字表所产生的社会效果看,确实对社会用字起到了重要的规范作用,初步实现社会用字的标准化,推动了我国教育、文化和科技事业的发展。但由于这些规范文件最晚也是在20多年前制订的,而随着国家现代化、信息化事业的快速推进,我国语言生活发生了巨大变化,旧有的规范已经不能完全适应现代社会的需要。因此,对此前的汉字规范工作重新审视,研制新的汉字规范标准,是非常必要的。这也是国务院当前颁布实施《通用规范汉字表》的重要原因。 任何系统都是由一些相互联系、相互制约的若干部分结合而成、具有特定功能的有机整体。作为书写符号系统的汉字也是如此,它由一定数量相互联系、相互影响的字符集合而成,发挥着记录汉语的功能。正如王宁(2004)所说:“汉字不是个别字符的随意堆积,它必须形成一个适应汉语词汇意义系统的构形系统,才能全面完成记录汉语的任务。汉字的优化,不仅仅是个别字符的优选,还必须在个别字符优选的基础上,达到字系的优化。”在当代,处于实际应用状态下的汉字系统,虽然经过了几次大规模的整理和规范,但如果用优化的标准去衡量,仍然有进一步调整的必要。对当代汉字系统进行优化调整,必须坚持三项基本原则,即共时原则、通语原则和效度原则。 一 共时原则 衡量某一时代汉字系统的优化程度,首先要坚持共时的原则。也就是说,在界定某一时代的汉字系统时,只能包括那个时代实际应用的汉字,而不是那个时代所存留的所有汉字总和。 汉字在发展的过程中,其数量呈逐渐累增的趋势。这一点从历代字书的收字情况可以得到印证。例如:公元100年东汉许慎的《说文解字》收字9353个,加上重文共计10516字;公元543年南朝梁顾野王编的《玉篇》收16917个;公元997年辽行均编的《龙龛手鉴》收字26430个,其中俗字较多;公元1011年宋陈彭年等编的《广韵》收字26194个;公元1066年宋司马光等编的《类篇》收字31319个;公元1067年宋丁度等编的《集韵》收字53525个;公元1212金韩道昭编的《改并五音聚韵四声篇海》收字56001个;公元1615年明梅膺祚编的《字汇》收字33179个;公元1671年明张自烈编的《正字通》收字33549个;公元1716年清张玉书编的《康熙字典》收字47035个,加上古文字字头共49030字;1915年陆费逵等编的《中华大字典》收字48000多个;1971年张其昀主编的《中文大辞典》收字49888个;1990年徐仲舒主编的《汉语大字典》收字54678个;1994年冷玉龙等编的《中华字海》收字87019个。 但另一方面,汉字在各个历史时期的实际应用数量却是有限的。例如:《十三经》的不重复单字数为6544个;《史记》的不重复单字数为6000个;18401首宋诗的不重复单字数为4520个;《毛泽东选集》四卷的不重复单字数为2981个;新华社1986年4000万新闻稿的不重复单字数为6001个;国家语委9100万字符的《现代汉语平衡语料库》(1919-2002),其不重复单字数仅为8288个。这说明,汉字在各历史时期的实际应用数量基本上维持在6000字左右,这与字书日渐累增的收字数量是相当悬殊的。 那么,字书超出实际用字量的那些汉字从何而来呢?研究表明,其中大部分是不同历史层面不同字体的积淀、重复造的字,甚至有一些是错别字,例如《汉语大字典》中“国”字有以下不同写法: