时代呼唤着“中文信息处理用拼音文字”国家标准的出台

作 者:

作者简介:

原文出处:
嘉应大学学报:社科版

内容提要:


期刊代号:H1
分类名称:语言文字学
复印期号:1996 年 12 期

关 键 词:

字号:

      【摘要】 中国的信息产业面临21世纪信息化社会的严重挑战,也是一次机遇。中国目前电子计算机之所以不能在全社会普及,其中一个原因,是编码方案的繁难与识字文化背景脱节和不统一。现有的编码方案,没有一个是与语言文字的教育、学习、使用相结合的。因此亟须制订出“中文信息处理用拼音文字”的国家标准,才能突破中文信息处理的瓶颈。“中文信息处理用拼音文字”,只能是在《汉语拼音方案》加以完善的基础上进行研制,只能是“拼音文字”的直接输入转换成汉字输出,而不是音码代符的输入转换汉字的输出。之所以要以《汉语拼音方案》为基础,是因为它的应用已经渗透到文化、生产、生活的许多领域中去了,有广泛的社会基础和群众基础,而且在国际上也已被广泛应用,并成为联合国、国际标准化组织采用为国际标准。因此,以《汉语拼音方案》为基础制订“中文信息处理用拼音文字”国家标准,是最佳的选择和决策。

      【关键词】 电子计算机 信息化社会 中文信息处理 拼音文字 汉语拼音方案 国家标准

      西方产业革命之后,使用拼音文字的西方国家将拼音文字打字机制造出来,并普及到寻常百姓家,迄今已200余年了。然而今天,中文打字机以其设备笨重、成本高、效率低、操作难,只作为企事业机关办公室里专门职业的打字员的“专利品”而无法普及到寻常百姓家!就像中国的印刷出版界的排字房一样,宋体、仿宋体、1号、2号、3号、4号、5号、大1号、小1号……黑体,斜体……中国印刷用的铅字房,整整地占满好几间几十平方米的大房间而令人望而生畏不已。排字工人为检字、排版要在几间大房子里来回走动找出所需要的铅字来,一天来回所走的路程竟长达几十公里。成千上万的汉字,需按部首或笔画的次序排列着,排字工人需要学习和记忆这些汉字的部首分类和笔画以及安放的位置和排列的顺序,因此中国的印刷出版业为此付出了沉重的代价并失去了印刷机械化的机会!中文打字机是在西方拼音文字打字机问世近百年后才问世的。然而中文打字机也与中国的印刷出版界的情况相类似。中文打字机需要把成千上万个汉字按部首或笔画安排在一个大字盘上,或用一个较小的字盘放置常用、次常用字三千多个;用一个较大的字盘安放通用字和少量的特殊用字(如姓氏用字、生僻难字、专业用字、地名用字和古代罕用字等)六七千至一万个左右。中文打字机操作人员也需要进行专门的训练和学习、熟悉并记忆汉字的部首分类和笔画结构以及字盘上汉字排列的位置和次序。操作时先看文本(或文稿)再把视线移到打字机字盘上找到所需的汉字,然后再移到按键上进行击键,再将视线移到印纸上看看是否准确地打出了所需的汉字。无论从设备的简易和效率来说,中文打字机实在太落后了。所以西方拼音文字打字机已普及到寻常百姓家一百多年后的今天,中文打字机仍然无法普及到全社会的寻常百姓家中!原因就是设备复杂成本高,打字机售价昂贵,普通老百姓的经济能力承受不起;其次由于字盘无法小型化(微机化),一般老百姓住房面积狭小,没有地方安放这种笨重庞大的设备;最重要的原因是效率低,需要专门训练操作技能和记忆字盘的铅字排列位置和次序,老百姓写字比打字还快,不需要效率低下的中文打字机。由于中文打字机的落后,中国又一次失去了普及打字机械化的一个时代!

      如今,即将跨入21世纪,中国又面临着信息化社会的挑战。我们要迎接挑战,抓住机遇,尽快制订出“中文信息处理用拼音文字”的国家标准,以促进电子计算机在全社会的普及应用。

      在当代,国际上国家与国家或民族与民族间的竞争或较量,是经济实力的竞争与较量,就是高新技术的竞争与较量。说到底,是人才的竞争与较量!谁在人才方面占据了优势,也就占据了高新技术的优势,也就会在经济实力上占据优势!否则就会落在时代后面,就会被时代所淘汰,就会被动挨打,沦为帝国主义列强掠夺、剥削、欺凌的对象!因此,我们一定要迎接世纪的挑战,把自动化、信息化的高新技术搞上去,并且要占据优势,才能立于不败之地!使五千年的灿烂文化再度辉煌,再次对世界的文明发展作出贡献!

      信息处理的方法大致有三种:由打字机键盘实现字符或代码输入计算机进行处理;直接图像(图表、形体)识别法输入计算机进行处理;直接自然语音识别法输入计算机进行处理。

      图像识别输入法就是利用光电检测器和电子变换器对图象进行识别和转换,这需要有高度的精确性和复杂的尖端技术,相对来说设备成本高昂、技术难度大。因为输入的图像各式各样:数量多、形体复杂,对模式的识别自然难度大,但是已经有了点触式或书写式等输入法投入应用。不过图像识别法还没有被普遍采用。

      语音识别输入法也由于几乎每一个人的发音不尽相同,设备的技术要求也自然很高很难,所以也没有被普遍采用。虽然已经有了很大的进展,语音输入已能识别几万个词语,但是人机直接对话还需加以提高和完善。因此语音识别输入法,也还没有被普遍应用,但它是计算机智能化的发展方向。

      目前应用得最普遍的还是打字机键盘输入法。

      1964年世界计算机产业的垄断巨头IBM公司说,要么消灭计算机,要么消灭汉字;断言汉字无法利用先进的电子计算机进行信息自动化的处理。

      可是1972年,中国上海的一位工程师打破了IBM公司的武断神话,他创制了一套汉字输入电子计算机的方法。从此中文信息处理方案的研究与开发工作蓬蓬勃勃地展开了,一片兴旺发达的景象,令人欢欣鼓舞,新方法、新方案不断地涌现出来!

      1978年在青岛召开了全国汉字编码学术会议,对汉字编码工作,从理论方法到原则、技术,以及具体的编码方案进行了热烈的探讨、交流和研究,真正做到了“百花齐放,百家争鸣”。时至今日,已申请专利的汉字编码方案有三四百种,已公开发表或已正式提出的方案有五六百种,合计汉字编码方案已达千余种。有人谑言说真是“千军万码”、“群雄割据”、“精英混战”。这种情况是喜?还是忧?

相关文章: