第四章 汉字编码设计的基本原则 §4.1 研究编码原则的重要意义 汉字编码原则是指在编码设计过程中的基本要求。它是编码客观规律在设计者头脑中的主观反映,是衡量具体编码设计优劣的依据,是完善编码设计的指导思想。 一、明确方向 汉字编码是为电脑的中文应用而来。电脑的工作速度使人们必欲得之;电脑的迅速降价,使人们可以迅速得之。在这个前提下,可以预测,电脑将很快普及到家家户户,并将迅速进入国际联网。但是,在这之前,首先必须要求统一全国汉字编码,并使之成为基础教育的一部分。我们将从儿童的识字教育开始,就授之以汉字编码的教育。 汉字是中华民族的瑰宝,五千年的汉字规律将因编码设计的成熟而得到弘扬,也会因编码设计的不成熟而受到损害;中华民族子子孙孙的记忆负担会因它设计的成熟而减轻,或者会因它的不成熟而增重;计算机中文应用的普及会因其成熟而加速,或者会因其不成熟而慢;计算机的软硬件会因成熟而发挥效益,或因其不成熟而大量浪费。 一百多年来,许多人意识到要改变中国的落后,首先要普及识字教育,提高全民族文化素质。“识字”,首先是“字”;“字”是物质,“识”是意识活动。所以,许多人便在“字”上做“文章”。为了方便识字教育和汉字的排序检索,国人在不断地研制汉字字形直接翻页检字的方案,改进老的部首检字法;为提高识字效率,搞拼音识字的实验。这些工作,都可以认为是汉字现代化的具体实践,但并不十分成功。因为,文字使用是全民族的事,是系统性的工程,必须具备全民普及的客观条件,具备成熟的客观的系统的需求,不具备这些条件,实践方法的考虑就不会完备。现在,我们面临一个计算机普及应用的前景,汉字输入使汉字现代化具备了系统的、全面的客观需求;汉字输入将普及全国每一个角落,具有全民使用的条件。于是人们才拆分汉字,研制汉字编码。努力从事研制和推广汉字编码的人们,并没有看到这是汉字五千年历史上的一次伟大变革,却把它认为只是为了电脑打字。低起点和低要求,以及许许多多的复杂原因,使学术界许多人迷失方向。研究编码设计的原则能够使我们明确方向,认清目标和目的。 二、揭示误区 当前的“万码奔腾”揭示了我们民族文化后面的一个巨大拖累:急功近利,过重实用。杜威先生说:“过重实用,则反不切实用。”科学发展,社会进步,愈到近代,时间的间隔愈缩短,没有理论高度,就会究于应付,实即不切实用。全国联网、世界联网、中小学生的计算机输入教育,这些工作,马上就会到来,要不要“上马”?在中小学的课堂里,能不能多种方案并存?背离原则的方案能不能上?当然的回答是不能。那么谁知道哪个方案是背离原则的?因此,必须扎扎扎实实地打好基础,认认真真地根据汉字发展的历史,依据社会学、心理学等科学知识,把汉字编码设计的原理和原则研究清楚。 蒋梦麟先生说:“在中国,发明通常止于直接的实际用途。我们不像希腊人那样肯在原理原则上探讨,也不像欧洲人那样设法从个别的发现中归纳出普遍的定律。”⑴ “中西思想重点不同的地方其中之一就是中国人重应用,而西洋人重理知。中国人重实际,常常过分强调实践过程中的困难,有时是实在的困难,有时只是想象的,以致忽视实际,问题背后的原理原则。”⑵汉字编码的问题正是这样。70年代到80年代初期,人们把搞出一个汉字编码,宣传得神乎其神,有的人把编码的困难讲得比上天摘星星一样;有的人把它吹得与早爱因斯坦并列。事宜证明这种困难“只是想象的”,否则,怎么能“万码奔腾”呢?中国能各此方便地出一个团的爱因斯坦吗?汉字编码的实践暴露了的正是我们只顾编码应用,忽视它“背后的原理原则”。 有的人认为“字形编码终将被历史所淘汰”,⑶意思是现在搞字形编码,将来终被淘汰,何必多此一举。这种说法不无正确之处,是因为“历史”总是永远在“淘汰”(更正确地应称之为“扬弃”)所有的东西,例如甲骨文、金文、篆文等都有个产生、发展、成熟的过程,最后它们都由于本身的弱点,不能适应新形势的要求而被新的文字系统所替代,当然它们合理的内核也在新系统中被保留下来。而现在的字形编码刚刚出现,就预言“淘汰”,实在不必要。因为,历史将在何时“淘汰”字形编码,现在的在世者谁都不会知道。任何人都不具有预言将来的能力,许多预言家都被历史所嘲笑,留下了的只是遗憾。丘吉尔先生说:“上天没有赋予人类在很大的程度上预见或预言的能力,这对人类来说是件幸事,不然,生活就难以忍受。”⑷设想人们如果能预见将来,世界上就没有挫折和失败,也同样没有奋斗和成功。 字形编码的出现,是为了修补汉字;系统在应用的过程中显示出来的不足,尽管在这个过程中出现一些缺陷,出现许多不成熟的实践,也不能说明就会被“淘汰”。当然,认真对它进行系统的实践和研究,是时分必要的。但现在有那么一些人在进行认真的研究之前,就预言“淘汰”,希望将之扼杀,实在是他们不理解不熟悉字形编码的设计原理和思路,发展的历程和结果之故。 三、探求方法 总结汉字变革的历史经验,我们就可以得到这么一个结论:汉字的每一次变革都是由于信息交换的速度提高要求而致的。“拆字编码”是汉字适应计算机应用而引发的一次重要变革,是一个必然过程,我们学术界应该发挥自己的主观能动性,坚持正确的设计原则,引导它走上正确的道路。汉字编码是汉字的一种副体形式,所以,汉字编码的设计的原理和原则,也就是汉字应用的原理和原则。 文字发明的伟大是因为它使人类冲破时空的障碍,以短的生命将获取的信息一代代积累起来留给后代。人类文明的发展就是这许许多多人的不料的信息积累。在汉字历史性变革的关键时刻,我们必须树立对文字使用的全面、系统的理解,即对汉字的造字法、造字历史和发展过程,汉字应用与汉字文化发展的全面系统的关系,汉字检字法的发展与应用,以及它的贡献和缺陷等等作全面系统的理解。 现在社会上有许多编码方案在随意分解汉字,破坏汉字内在规律。如果让这些不良的方案侵入基础教育系统,建立起它的“阵地”,且任其泛滥,后果将不堪设想。所有的文字工作研究者和教育工作者都必须理解坚持汉字编码设计原则的重要性和必要性;必须充分认识这次汉字因编码引发的变革的深远的意。并认真地将编码设计这一非常严谨的工作置放在科学的原则之上。 我们认为汉字编码的设计,必须遵循历史性原则、涵盖性原则、系统性原则。坚持科学的、有原则的设计思想,就能克服目前汉字编码研究中存在的种种弊端,使其走上正确的设计道路,进而统一全国的编码方案,迅速实现计算机中文应用的普及,实现“书同文”,实现汉字现代化。下面我们就要对这些原则作一番深入的探讨。 |