湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

 

第一章            汉字编码设计学的性质、意义和方法

 

汉字编码就是把汉字编为键盘上的符号代码。键盘上的符号是有序的,因此,汉字编码就是为汉字设计一套有序的符号系统。汉字编码设计学是研究如何为汉字设计一套符号系统的学科。

单字的编码是根本。一个字符集的所有单字的编码称为码表。

   

§1.1  汉字编码设计学的几个基本概念

 

为了了解汉字编码设计学的研究对象,我们首先要对下列基本概念加以剖析。  

一、            汉字与编码

汉字是随着中华民族社会发展而需要的信息交换与民族语言相适应的书面的符号体系。汉字作为一种文字系统来记载语言的特殊的社会现象。所谓“特殊”是因为它不能表音,书面语言与口头语言并不完全一致。它缺乏明显的线性、序性,不容易排序和检索,不易为现代科技应用;它的多符性又使人觉得难学难记,影响识字教育的迅速普及,有人曾经藉此说汉字是中华民族落后的根本原因;还有人甚至认为是“汉字阻碍了我国的现代化”。但另一些学者则不同意这种观点,他们认为汉字并不难学,认为拼音识字不但不能缩短识字时间,反而增加识字负担。有人甚至还认为汉字对开发儿童的右脑智力,促进形象思维有积极意义。最著名的是华师大曾圣初教授,写了一篇《汉字易学易用证》,列举了许多实验的例证。可见汉字是否难学,至今未有定论,但难检的毛病却是确确实实的。人们正是为了克服这个困难而研制编码的。

部首检字法由于不能直接排序使人们不满意,一直研究取代它的方法。近代增加的音序检字法,也不具备涵盖性而没有使人们满意。初期鼓吹拼音识字的先贤,并没有意识到汉字适合我国的国情,有利我国的文化教育事业;也没有发现拼音文字因为是有所序的,才适合现代科技和社会管理的应用。

以汉字的难学为主题的改革活动——汉字拼音化,起始目的只是为了提高识字速度,并不是为了排序检字。现代社会要求汉字能直接排序以便于实现全社会统一文字应用的管理,同时提供给现代科技应用。汉字编码能使汉字成为能拆能拼、线性、少符、有序性的符号系统。因此,可以认为编码是拼形方块汉字的另一种表现形式。编码系统只是为补充汉字系统中的检索排序的不足而设计出来的子系统。

为了使用电报技术,国人不得不研制和使用电报码。在电报码中,我们得到的认识是:汉字编码就是:汉字+有序符号。这些符号之所以有序,是因为它们的数量不多,如0—9等10个数字,A—Z等26个英水字母。人们已经将它们排成序性行列,方便学习和记忆。而且,这些数字或英文字母,都已在国际通用键盘上有固定的位置。汉字编码利用它们来代表汉字,便于汉字的现代应用(社会管理、排序检索和电脑输入)。一个即将到来的社会现象是计算机应用教育进入中小学,儿童从小即需要接受它的使用能力的培养,其第一步就是要接受汉字如何编为代码的教育。  

二、汉字编码与键盘输入法

如果汉字是有序的文字,我们现在就不用研制汉字编码了。英水、法水、俄文都不要编码,而中国人使用的汉字却需要编码。因为,外国人的拼音文字使用几十个有序的音素符号就可以拼出它们的文字,而汉字却无法用音素符号拼出来。外国人用音素直接组词,中国人只能使用“字”来组词。这当然是中国语言文字的特殊性。

计算机输入,实际是从计算机中检出汉字。汉字编码兴起的初期,我们不知道这个道理,才提出了“汉字编码输入法”这一错误概念。这个概念,把汉字编码与汉字输入法混淆了。这不是什么人的错,是时代条件的局限。现在我们必须把这两个概念分清楚。

按照一定的规则,使汉字组成一套能拼、线性、有序性符号系统,称为汉字编码;而利用汉字编码、键盘设备、计算机资源和输入员将汉字输入计算机的方法称为汉字键盘输入法。

键盘输入法是指在键盘上如何输入汉字。汉字编码是它的基础而不等于它。汉字编码仅仅给每个汉字以一定的有序符号,是一种静态的编码形式。现在键盘输入的主要形式90%以上是动态的,包括简码和词组。简码不属于静态编码,是高频字的输入安排;词组输入需要静态编码的重新组合,根据词组的长短,确定取码的方式,然后进行输入。单字的静态编码,输入时组合为词组叫动态输入,因此,词组就是动态编码。动态编码有两种形式:一种是先建立常用的词组库,输入时可随取随用;二是用户自定义词库,即输入时发现自己专业需用的词组还没有,可以利用软件功能随时建立。问题在于汉字的单字自身也是词,作为汉语输入,单字词常来弥补词组输入的不足。但是,单字编码在实际输入使用中,所占的成分并不很多。它只是汉语输入的基础。学术界长期以来没有把这两个概念分清楚,以致大家都把汉字编码当作汉字输入法,使键盘本位的设计思想,长期占领编码研究阵地。由于错误概念误导,才有了连续不断的输入速度比赛。因此,就有人著文要求编码设计必须具备“易学性和快速性完美结合”⑿这显然是不可能的。  

三、编码因素与非编码因素 

编码因素是指与编码方案有关的各种规则和方法。如汉字拆分的原则和规则、分类的原理和方法、编为代码的理由和方法等等;非编码因素是指与编码方案设计原理无关的一些要素,如输入速度、取码规定、简码安排、输入软件的兼容性、输入的软件程序、键盘设备以及输入员的素质、技巧和熟练程度等等。

1986年,全国已有四五百个编码方案,举行过一次汉字编码评测活动。评测的主要依据是编码方案的输入速度和重码率。事后作了一次总结,一些专家认为这次活动参进了一些非编码因素,把非编码因素作为评测的依据导致失误。有的人并不知道失误的根本原因是因为学术界推出了“汉字编码(键盘)入法”的错误概念,而委之为参进了一些“非编码因素”,不是认真地、科学地从根本上总结经验教训,而抓个某些枝节,掩盖概念错误,致使导向长期失误。

 

《汉字编码设计学》目录

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有