“万码”观止
序
我们中国的汉字,是由汉字笔画书写而成的、记录汉语、标记事物、传承文化、交流信息的符号系统。信息时代要求汉字信息化。所谓汉字信息化,就是用现代信息技术处理汉字信息。在现阶段用现代信息技术处理汉字信息,其关键是通过通用的计算机英文键盘将汉字输入计算机。在二十世纪八十年代,人们敲击通用的计算机英文键盘直接输入西方的文字,西方的文字进入信息化之初,计算机在中国刚刚开始普及之时,汉字信息化遇到的最大难题是怎样用通用的计算机英文键盘把汉字敲进去,即用通用的计算机英文键盘将汉字输入计算机?用通用的计算机英文键盘将汉字输入计算机,即汉字的键盘输入,关键是汉字编码。如果不解决“汉字编码”这个问题,汉字就没法用通用的计算机英文键盘输入计算机,汉字信息化就无从谈起。如果解决了“汉字编码”这个问题,汉字就能够用通用的计算机英文键盘输入计算机,就能够用现代信息技术处理汉字信息。
在汉字信息化遭遇键盘危机之时,学术界有人断言:“计算机是汉字的掘墓人,是拼音文字的助产士”。一种“汉字拼音化”、“汉字拉丁化”、最终废除方块汉字的噪声响起!在这汉字信息化遭遇键盘危机之时,种种不同的用通用的计算机英文键盘将汉字输入计算机的汉字编码, 诸如“音码”、“形码”、“音形码”等,如雨后春笋般地相继问世。在几十年间出现了上千种编码方法,形成了“万码奔腾”的局面!
汉字键盘输入方法的发展过程,是“万码奔腾”的过程。“万码奔腾”证明了汉字是可以按编码敲击通用的计算机英文键盘输入计算机的,汉字是可以信息化的!那种“把汉字改成拼音文字”、最终废除方块汉字的主张是错误的!“万码奔腾”证明了“码家军”能够将汉字输入计算机。“万码奔腾”对我国计算机应用的普及起到了开路先锋的作用。中国人能够实现汉字信息化!在这“万码奔腾”中的涌现出来的“码家军”是好样的!
与此同时,我们更应该看到“万码奔腾”的另一面,这就是“码家军”上演的,种种冠以不同圣名的汉字编码所呈现的各领风骚,各显神通,有碍于汉字信息化发展的混乱局面。直到目前为止,现在使用的种种不同的汉字键盘输入方法——汉字编码,无论是“音码”、“形码”、“音形码”,无一不是主观臆断地从汉字的多元的特征信息中截取汉字的某些特征信息,“天女散花般”地把它们“安放”在通用的计算机英文键盘的不同键位上。繁杂无序、无规律可循,让汉字编码的使用者死记硬背,还自我吹嘘如何“好学”“好用”!尤其是种种不同的违反国家汉字规范的“拆字编码”(准确地说是拆分独体字编制“形码”),给计算机教育和应用以及规范的汉字教育,给汉字信息化的发展,造成的不可忽视的负面影响。并且这种负面影响随着这些汉字键盘输入方法应用时间的延续、范围的扩大成正比发展!
显然,两千年前,我们中华民族要“书同文”,现阶段我们中华民族要“输同码”。我们期待着像“秦王扫六合”那般,早日结束中国的的汉字编码——“码家军”呈现出的“万码奔腾”,各领风骚,各显神通的混乱局面,早日统一计算机键盘输入汉字用的汉字编码,实现“输同码”。
那么,我们翘首以待的“输同码”,即中国统一的汉字键盘输入方法——汉字编码,究竟应该是什么样的呢?
显然,我们应该冷静地反思“万码奔腾”中的种种不同的汉字键盘输入方法——汉字编码,包括“音码”、“形码”、“音形码”,究竟是因为什么无一不是主观随意地截取汉字的某些特征信息元,“天女散花”般地把它们“安放”在通用的计算机英文键盘的不同键位上,繁杂无序、无规律可循,让汉字编码的使用者死记硬背?
汉字编码的实质是为汉字的计算机键盘输入编制一套有序的符号系统。如汉字的电报码、区位码是一套有序的符号系统。但是汉字的电报码、区位码,不是根据汉字的基本规律科学地提取汉字的特征信息元素编制的,而是主观地利用“0~9”十个数字编为四位数的号码来代表汉字,编制的。汉字的电报码、区位码的码元与汉字的特征信息元素没有任何联系,无规律可循,需要死记硬背。
汉字的计算机键盘输入所要求的有序的符号系统——汉字编码的编制规则,是由汉字的基本规律决定的。汉字的基本规律是汉字编码的编制者和汉字编码的使用者的共同语言。汉字编码的编制过程和对汉字编码的使用过程,是识别和使用汉字的的过程。如果汉字编码的编制者所编制的汉字编码违背了汉字的基本规律,那么这种汉字编码的使用者就无法根据汉字的基本规律学习和使用这种违背汉字的基本规律的汉字编码,就无法根据汉字的基本规律“见字知码”,对这种汉字编码就只能死记硬背。
汉字的计算机键盘输入所要求的有序的符号系统——汉字编码,应该是根据汉字的基本规律,科学地提取汉字的特征信息元素编制的。不应该是主观随意地截取汉字的的某些特征信息元素编制的。因此,我们更应该冷静地翻开国家标准信息交换用汉字编码字符集,弄清楚这2万多个汉字的基本规律,我们所寻求的答案及其根据就在其中。
(未完待续)