湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

 

§1.3  汉字编码设计学研究的重大意义

 

汉字编码研究具有重大的理论意义和实践意义。

一、理论意义

汉字编码设计的实践揭示了汉字现代化的发展方向。

随着计算机应用逐步铺开,全国编码研制从少到多,由冷变热。十几年内,竟出现上千种编码方案。国标字库只有6000多个汉字,平均6个字出一个方案。如果长此下去,上万上亿的方案都可能产生。因为,作为编码设计的基本材料,部件和键符,都没有规定的数量。二级字库有几百个部件,键盘上有101个键,所有的设计者都可以任意取用,根据排列组合,就可能产生无究尽的方案。

现在这么多的方案,如何才能挑选出一个最好的交付全国人民共同使用?

有人主张让市场(用户)决定选举。他们不明白市场是经营家的事。市场需要的是软件的功能和硬件的质量。而汉字编码却是文字科学,是规律、规则和方法。

编码专利使编码变成商品。商品丰富是件好事,编码多了却是件坏事。汉字编码是文字工具,不是一般的工具。一般工具越多越好,多了可以根据不同的具体情况随时调换。文字工具是全国人民用于教育和信息交换的,只能统一使用。使用不良的文字工具,就如吸毒上瘾,久了就无法纠正。不可能设想,一个使用统一文字的民族,在中小学教育中,会使用多种不同的编码方法。国家教委仅为少数几个不规范字已经伤透脑筋,而编码关系到所有的汉字,关系到汉字的体系,一步不慎,贻患无穷。当然,问题不在于方案的多少,而在于如何判别,这需要理论指导。

方案越来越多。如果要问汉字编码要不要统一?实践提供的答案是:编码不能不统一,也不得不统一。那末汉字编码如何才得以统一?下列答案已被越来越多的研究者所认同:编码统一的唯一的方法,就是寻找汉字结构和编码设计结构的客观规律,开展对基础理论系统性的研究。建立汉字编码设计学还有一个意想不到的好处,就是它还能帮助汉字进行更科学的简化。实践证明,我们之所以不断地重复错误,是缺乏对以往的实践进行及时的建设性的理论归纳,建立汉字编码设计学为当前的汉字现代化理论作出贡献。

(一)   揭示汉字现代化的基本规律

一百多年来,许多人追求汉字现代化并做了不少工作,我们可以把这些工作归纳为五个方面:

⒈汉字拼音化;

⒉汉字简化;

⒊汉字书写规范化;

⒋汉字直接翻页检索;

⒌计算机中文应用。

其中,汉字简化和汉字书写规范与汉字拼音化的矛盾是不可调和的。因为,汉字简化和汉字书写规范是为了完善和巩固方块汉字的使用功能,也就是巩固了方块汉字的存在地位。而汉字拼音化的目的是推翻方块汉字,以拼音汉语取而代之。方块汉字的巩固更不利于以汉语拼音文字取代。

其实,只要能实现汉字拼音化一项,其他四项也就随之解决。因为只要汉字能够拼音化,那末:一是汉字简化就成为多余之举;二是只有汉语书写的规范,而不需要汉字书写的规范了;三是使用拼音字母的汉语已经有序性,既能直接输入计算机,也可直接翻页检字。所以,相当一部分学者认为只要牵住拼音化的牛鼻子,汉字现代化的五个问题即可迎刃而解。当计算机技术进入我国市场,中文信息应用要求随之而来,全拼输入无法解决急迫的市场需要。但已经占领市场的“拆字编码”却缺陷甚多,而拼音文字有得天独厚的序性,在计算机上可以不用编码而直接输入,使一些人再度想圆拼音化的美梦。然而,可以预料,至少在计算机普及到全民的这一段时间里,想实现汉字拼音化,确实太不现实。

人们面对汉字现代化一筹莫展的时候,研究“拆字编码”设计的发展,使我们进入一个新的学科领域。实践揭示把汉字拆为部件,既可用于电脑输入,又可有助识字教育,更可用于排序检索,如下图所示:  

汉字

 → 

编码部件

 → 

识字教育
排序检索
电脑输入

 → 

图书
资料
档案

 → 

汉字

如上面所示,将汉字拆为部件,它的基本符号就能从上万个减少到几百个。这些基本符号的笔画数只有1~9个。而且,5个笔画以下的占87%。9个笔画的部件只有2个。这个统计说明,儿童识字教育初期,教会全部部件,只需要很少时间,然后再用它们拼学汉字,不仅将可大大节省识字时间,还有利于同时纠正教师和学生的错别字。这个道理并不复杂,它说明将汉字拆为部件,极其有利于实现我们提高识字速度的愿望。

将汉字拆为几百个部件,根据各个部件第一个笔画出现的先后,就能使每一个方块汉字成为线性排列;根据这几百个部件的结构和特征将它们分为几十个类,每个类取一个有序的键盘符号作为代码,方块汉字就带上了直接的序性,既可用于排序、检索,同时也可用于电脑输入。汉字现代化也就全面实现了。

信息时代是科学发现大爆炸的时代,中国人能不能迅速走进信息时代,将取决于中国人能不能真正发现和统一使用一种符合汉字内在规律和编码设计规律的汉字有序符号系统。当此之时“拆字编码”的计算机应用实践给文字学界带来了一个意想不到的启迪:汉字字形结构在输入中显示出巨大的优势。它的规律正在应用的实践中被逐渐揭露。为了更进一步揭示和归纳“拆字编码”在实践中显现出的规律,建立汉字编码设计学确实有重大的现实意义。

(二)   开创汉字书写的新纪元

中国人本来是用一只手执笔杆,一笔一画写字的,现在却要统统改为用两只手十个指头击键写字。键符越过笔画,代表部件写字,在键盘上使用编码检出汉字,就是用编码写字,键盘就成为我们的笔杆了。这种以检字来使用汉字,提高信息交换速度,对中华民族的汉字来说,这是几千年来前所未有的一次翻天覆地的大变革。回顾汉字发展的历史,从甲骨文、金文、大篆、小篆、隶书,到现代汉字,它的变革,都只是笔势上的变革,而没有牵涉到它的结构。而这一次,却牵涉到它的结构——把汉字拆分为部件。因此,这次变革,不仅给我国人民将带来巨大的好处,还将使蒙辱一百多年的、背上“落后”黑锅的汉字,重新展现它的光辉。

键盘代替了笔杆子给我们带来很多好处,它提高了了工作速度,代替了记忆功能,缩短了信息交换的时间和距离,节约我们有限的生命时间资源,使我们有更多的时间、以更快的速度探求宇宙间的物质奥秘。

历史的局限曾经使我们对汉字编码的真正内涵没有立即理解,以为汉字编码就是汉字键盘输入,不讲键盘输入的编码就不能独立存在。时间已经过去十年多了,情况未有根本改观。如果我们在这十几年来一直重视它的基础理论建设,严格要求它符合文字教育方面的规范标准,全国就不会冒出这么多的方案,不会出现这么多的低水平的重复。1986年也就不会产生以汉字键盘输入来推荐汉字编码的错误做法,不会出现以输入速度比高低,以重码率比优劣的误区。

实现全民普及键盘输入,以使全国信息交换网络化,必然导致汉字输入方法加入基础教育。汉字部件,通过编码方法编为键盘代码,经识字教育或排序检索(用于图书、资料、档案管理),或电脑输入三条路径,“还原”为汉字。因此,绝对不能把它理解为单纯的电脑输入。事实说明,对汉字编码进行科学的设计理论研究,就是为了开创一个汉字书写的新纪元。

(三)填补汉字字形研究的理论空白

计算机技术的迅速发展,它迫使我们必须立即考虑建立信息高速公路的需要。中国人要么迅速研究汉字编码的统一,要么推迟信息化时间。当然我们不会选择后者,否则中华民族就会永远落后,万劫不复!

随着中午民族文明的发展,人们不断改进汉字的使用效率。计算机技术的出现和发展,展现出一个信息运用的新世纪,人类的科学文明因此将突飞猛进。作为加速信息运转的工具——计算机,必须有相应的信息载体——少符、有序的文字。可是汉字的多符、无序却使它的运转产生困难。于是,中国人创造了“拆字编码”(字形编码):把汉字拆为部件,减少符号的数量;借用有序的键盘符号为代码,使汉字序性化。实践证明,“拆字编码”使汉字适应了计算机的高速列车的运转;“拆字编码”使汉字进行信息交换的速度又挤到了各种文字的前列。原来被认为“落后”的、无法为现代机械使用的汉字,其优越性又再一次展现。“拆字编码”的现实意义在于它表现了汉字面临现代技术的挑战时的应变能力;它宣布了企望以汉语拼音文字取代方块汉字是不现实的梦幻。这是汉字的机遇,也是中国人的机遇。有的文字学家曾经悲叹汉字使“中国人丧失了一个打字机时代”,写下许多论证汉字只能拼音化的专著。于是,字(语)音研究成为热门,字形研究成了空白。文字学界对字形研究的陌生正说明我们现在研究的伟大意义在于不仅填补了这一空白,也证明了汉字的成熟性。

二、实践意义:键盘输入;基础教育;社会应用

(一)键盘输入

作家韶华学了半个月的五笔字型输入法,没有学会。后来知道了表形码(汉字拼形字母系统是在表形码的理论和实践基础上建立起来的),要了一个输入软件,一天就会了。他就给表形码的设计者陈爱文送了“作家福音”四个大字。几年后用表形码写了几百万字的作品。《文汇报》社接触表形码较早,现在全部全部记者都用表形码工作。1993年《广州日报》为了扩版而不增加人员,副总编张增志赴上海《文汇报》取经。回去后不仅全社用上了表形码,还多处开办学习班,培训了几千名学员。诸如此类的事,不胜枚举。然而我们的国家这么大,科技落后,信息闭塞,个别单位和少数人的一些活动,很难引起注意。

就键盘输入而言,原四通公司王辑志总曾说表形码比五笔字型有高上一个数量级。这话说得很笼统,但表形码易学易记,已被越来越多的事实所证明。虽然在市场上我们很少听到表形码的声响。这是因为,汉字编码没有被当成科学,只被当成商品。在市场上推销的商品,能否销得旺,主要是推销员的能力。

事实说明任何一个编码,只要做成输入软件,都可以作键盘输入;而并不是每个编码方案,在理论上都能经得起推敲。

(二)基础教育

使电脑真正成为人们学习和工伤的主要工具,是需要一种合理的汉字编码而不是输入法。汉字编码方法是多种多样的,而评价它的优劣并不是在于它的输入速度,重码率或码长等等,更主要是它是否能体现汉字的本质特征,是否有教学价值,是否可能为我们的基础教育及接受。

在教育教学工作中,教师迫切地希望能掌握一种汉字输入方法,以提高工作效率;把汉字输入列入教学内容对学生来说既是一种劳动素质的教育,又能使他们他们初步了解计算机基本性能。但是,决不应该背离汉字规范和 规范。

北京京华私立小学的实施情况说明:通过两个的小时的授课,三个日小时的实际操作,多数教师已经初步掌握表形码的输入方法,效果良好。在第二天所做的作业(自选古诗五中,已经能基本地操作,在以问卷方式进行的测试中错误率很低。其中三位老师成绩为100分,最差的也有96.24分。在辅导过程中,出现编码错误主要有以下几种原因:

1.由于不规范书写造成的错误(如“地”和“切”,“分”和“会”等)是最常见的。由于表形码正确地剖析了汉字的结构与特征,所以表形码本身具有一种“正字”功能,引导人们规范地书写汉字,这正是表形码的教学价值所在。

2.由于错误的书写笔顺造成的(如“为”、“随”等)。正确的书写笔顺也是汉字规范化的一个方面。

3.在拆字过程中,出现了一些拆字错误(如“成”、“良”等)。主要原因是记不住拆分规则。

4.生僻字由于书写错误造成错误编码。

北京师范大学实验小学一年级三班也做过同样的实验。这个实验报告说明一年级的小学生也很容易接受字形编码训练,经过短早间的部件和语文的穿插教学,不仅能以字形编码输入计算机,而且不影响语文学习,还可以纠正错别字,提高形象思维能力,扩大识字面。(具体实验报告,参阅潘德孚著《汉字要走出编码时代》,1994年11月电子工业出版社出版)

现在,信息界有一个通病,就是忽略了“计算机从娃娃抓起”这个伟大的战略决策。“计算机从娃娃抓起”,就是要把儿童识字教育和计算机汉字输入紧密地联系在一起,决不能把计算机中文输入与识字教育视为漠然无关的两码事。

绝大多数汉字是由多个笔画交互组合的方块形式,利用笔形和组合的变化改换汉字的意义。有的字笔画较多,由于轮廓特征认知,笔形变化小,容易产生错别字。国家教委多次要求端正书写规范,但始终收效甚微。所以,钱伟长先生说:“人的识字心理活动规律证明人由于人们通常在记忆中所保持的字形是一种模糊映象,多属字的外围轮廓部分(特别是边角突出部分),能反映其字形结构特征;所忽略甚至遗忘的往往是字的中间部件。”⒀可见,忽略某些字的笔画是一种通病。有的字则因读音相同,因音忘形,故从文字学家到语文教师,少有不写错别字的。积疾有因,难遂所愿。外国人学中文,不熟悉笔画系统,困难更大,笔画多的字,难以记住。现在我们可以不管汉字笔画的多少,只要记住几个块(即拼形字母)的组合,就可以毫无困难地、不遗漏任何笔画书写笔画复杂的汉字。

(三)社会应用

现在有的编码方案在编写字典,说明编码法就是检字排序法。

1992年6月,电子工业出版社发行由蒋文钦、吴蓉江主编的《表形码编排字典》,读者只需花几个小时,就可以掌握一套检字方法,同时可做电脑输入。《广州日报》于1993年推广表形码,举办学习班,几个月就发行了3万册。因为,学会了检字法就等于学会了编码法。今后如果把它用作各种档案、图书、资料的排序检索方法,用于全国的统一网络之中,全国的信息高速公路就能通行无阻了。

现代科学技术的文字应用,要求汉字有直接的序性,最好能用几十个有序的符号表示出来。电报技术对汉字的现代使用,进行了第一次冲击,幸好电报技术并不是全民都要掌握的,所以电报码尽管难学难记,但由于没有普及全民,所以它不但没有留下不好的后果,还是为我们使用电报技术作出力所能及的贡献。电报码是一种无理的字形编码,记忆困难,因此它不能成为检字方法。

实践说明全国如能实现统一的汉字编码,实际上也就是统一了全国的汉字排序检字法,全国以至全球的信息高速公路的基础从此得以奠定。

 

《汉字编码设计学》目录

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有