湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

 

§7.3  汉字拼形字母系统建成之思考

 

一、汉字拼形字母系统与表形码之异同

(一)汉字拼形字母系统是表形码的科学的完善

表形码把汉字编码发展到最高阶段——部件码阶段,它的成熟标志是:

1、从部件定义到拆分、分类、取码、映射,它构成的是一个完整的编码体系。

2、它的笔画结构分类系统是一个客观的科学的系统。

3、它的“形(部件)——形(键符)”映射法比之“形(部件)——音(键符”映射法,不仅是更直接的转换,而且具有时空的涵盖性。

时空涵盖性是指现在的部件表是在国标二级汉字库6763个汉字中分解出来的。如果字符集增大,要包含更多的汉字。如日本、朝鲜的汉字,香港、广东的地方字,古籍里的一些死汉字,它们之中也会分解出一些新部件,也能够在我们的部件清单中得到相应的序位,即,能很快归类并得到相应的代码。因为,任何一个新部件,都离不开基本笔画结构,以及这42个结构特征。

表形码已经使汉字编码臻至成熟,陈爱文先生早就提出了拼形字母这个新概念,但由于种种原因,从1987年到1996年,表形码也出了多个新版本,修改的目的,大都出于商业考虑,而不是科学的要求。这些版本就象五笔字型的第一版到第八版一样,修改者无法说明版本“提高”的道理。有时候,这些版本的某些改动,甚至使原版本斋降低。由此可知,必需在认真的理论探索的基础上,才能得到真正的科学的提高。

我们在认真研究汉字的造字历史、造字方法的同时,研究了汉字改革编码的发生和发展,归纳出“拼形造字——拼形文字——拼形字母系统”这个全新的汉字体系,奠定了进一步发展和完善表形码所建立的基础理论系统。

(二)31码元改为26码元

“所以说整个惯常的完成,便是智慧的隐灭。况且社会的进化,往往是由于打破惯常得来的。可见惯常没有不行,太固定也不行。善于运用历史的人,能顺天应人,是利用惯常;能革故鼎新,是打破惯常;能移风易俗,是改造惯常。取惯常之长,略惯常之短;体察惯常以定其经,超越惯常以达其变;为惯常之主,不为惯常之奴……”。(2)

惯常永远是创新的阻力。

“编码自恋症”是一种通病。没有一个编码设计者会觉得别人的编码比自己的好。这是因为他对自己的编码的使用太熟悉了,他会觉得自己的设计易学易用,而别人的总还是需要学习和记忆。对使用者来说,莫不如此。熟悉五笔字型的老师,永远不想改行教别的编码,即使他已经知道五笔字型损害汉字规范。这就构成了“惯常的完成”,无法再继续进行改进和完善。熟习表形码31码元的人,也会觉得31码元研究好用、好记,而认为26码元不行。还有人则以为表形码利用笔画的可数性将相离型部件与五个数字对应是一个特殊的创举,改为26码元并不见得恰当。关于利用部件的形象或可数性进行映射的问题,在表形码之前的王码象形码,早就这样了,并不是表形码的独创(请阅第三章)。我们考虑的不是现在用的怎么样,或者,已经用过的人是如何如何反映的,而是考虑更多的人应该如何学的问题。

还有人认为,许多使用拼音文字的国家都不是使用26个字母的,我们何必把自己限在26码元呢?将31码元换为26码元有利与英文打字相结合,是考虑中学生在练习26键的英文打字后就不需要更换指法运作,也有利于国际接轨。尽管除英语国家外其他国家也不是限于26个字母的,但26个字母的英文字母键盘是国际通用键盘,日、德、法等诸先进国家,比中国人更普及英语,可以说英语是几乎没有“国界”了。何况汉字拼音字母也只有26个,键符读音如不使用英语读音,也可使用汉语读音。因此,用熟26键输入并不“吃亏”。使用31键比使用26键可以减少重码率,理之当然。码元越多,重码越少。26码元的重码,经研究不会影响工作效率,这是主要的。只讲减少重码,而不知道为什么要减少重码,无疑于瞎子摸路。重码问题请阅本书第三章第一节中的关于重码的分析。这里不再重复。

既然汉字编码的使用就是汉字的使用,在表形码尚未大量为社会使用之前,完善它是研究者不可推卸的责任。科学研究的人不应为惯常所左右,而应该左右惯常。

(三)零乱的部件群成为有序的部件群

我们必须知道,汉字编码设计是文字学的一个分支,它涉及基础教育。确定一个部件,或确定一个汉字的拆分,都应该是十分严谨的,不能这样也可以,那样也可以,模棱两可的。尽管表形码已经把汉字形码发展到科学的部件阶段,但并不能说已经完全完善无缺了,仍需继续研究提高。这个研究与提高,必须进行宏观的概括和微观的分析。我们在一至四章里做的工作,就是宏观的概括;在五至七章里做的工作,就是微观的分析。通过宏观的归纳和微观的分析之后,在表形码的基础上,建立了汉字拼形字母系统。也可以认为,这个系统,不过是表形码的一个新版本。但是,这个版本不再是原地兜圈圈了:

1、通过“部件的证明”,按部件的属性清理了表形码的部件清单,将表形码中的组合部件类除名,连同“ 、马、⺮、禾、”一起拆分,增补了“、⺋、”等五个部件。剔除了“”两个部件,增加“、旡、”等四个部件。

2、将零乱的部件,整理成有序的系统。举个例子,在表形码的部件里,两个笔画相离的部件类中,有15个部件,陈尚农先生著的《电脑打字七日通》是下列格式的:

二八刂冫丷

以上的这种排列是混乱的,无序的。汉字拼形字母系统将“八”与“”合并,14个部件按下面的格式排列:

巜丷

这种格式是按笔形、方向的序安排的,即:横、竖、撇、点、折、上、下、左、右,余下的件仍按笔形变化的序:竖撇、撇竖、点竖、点撇,只有一个“刂(立刀)”作为最后的附带部件。这样经过排序,便于教学,利于记忆。每个类都是如此经过慎重安排,每个部件都有自己的序位,这也是本系统与表形码的最大的不同(详见本章上一节)。

3、为避免“止、(年)”与“(延)、(舛)”中的部件混淆,增加“”两个部件,因为,两者的区别差一个笔画,因此必须严格区分。这样更符合教学规范。专家们可以认真对照,本系统是表形码的科学的完善。

4、认真修改了表形码的拆分规则,使之更完善。(参见本书附录一和电子工业出版社出版的《电脑打字七日通》,陈尚农著。)

二、汉字拼形字母系统应用和简约

汉字的识字教育分为两个方面:一是读音,由于我们使用了一套统一的拼音字母,几十年来,它对全国的语音统一,显示出它巨大的效能。二是字形,过去我们在学生的识字教育里只教全字形,没有教拼字的部件,现在我们如果能够增加部件教学,识字后的效用将大不相同。如我们能认真行之,汉字史将为我们写上新的一页。一百多年来,中国人又汉字现代化追求的目标,将一一实现。这些目标可分以下几点:

(一)提高识字速度和实现书写规范

儿童在识字教育初期就接受拼形字母系统的授教,学好每一个部件的书写规范,以后只要用拼合部件的方法识字,不需要再记忆复杂的笔画结构,因而提高识字效率;部件拼合汉字就象搭积木,提高儿童形象思维能力;同时提高辨识错别字能力,实现统一书写规范。

(二)直接翻页检字

每一个部件既已有了序性,我们的字典检字就不再需要用笔画查部首,用部首再查需查字,而是随时可以直接翻页查到它们。同时全国也可以官衔一种统一的汉字排序法,任何地方、部门的资料、图书或档案,都不再使用自己独特的排序,而是使用这种统一的方法,就会更有利于信息交流。

(三)统一电脑汉字输入

“万码奔腾”将结束历史使命,各种方案不需再利用商业行为争夺市场。各个汉字系统的研制单位不需再为汉字编码伤脑筋,集中精力投入输入功能上的研究和竞争,系统的智能化就将很快成熟和完善,进入国家规范。在这个时候,全国统一联网就等待我们去实现了。

(四)帮助汉字简化和简约部件

部件清单还有一个特别的妙用,就是可以帮助简化汉字,端正原来的那种只顾减少笔画,不顾拆分方便与否的做法。历史的经验是简化汉字,不如简化部首。例如简化一个“言”旁,连带了很多字的简化;而简化一个“临”,把三个口,简化成一个“”,反而增加一个生疏的部件。而且这个部件,只在“临”字中用得到。一个简化字,增加一个新部件,实在不上算。简化一个部件的笔画,就可以使与这个部件有关字都一起简化,因此,研究部件简化比研究字的简化要合算得多。部件清单给我们提供了研究的基础,例如“止、”和“”,是否可以考虑都向少笔画部件合并,这样做还可以减少混淆,也没有什么损失。总之,利用部件研究帮助简化,比直接研究字的简化,其一是效率高,其二是有利拼形文字的进一步发展。

369个部件当然还不能算最简约的,我们希望还要更少,更精炼。在第六章里,我们批评了“替代拆分”,觉得某些替代太不合情理,例如以“丰”代“”,以“斤”代“丘”,其理由是这些替代改变了结构和笔画顺序,使老师无法教学。但是,另一些“替代拆分”,也给了我们一种启示,是否可以考虑形象相似,笔画的数量、顺序、结构基本一致的部件进行合并,以减少部件总数?我们认为是可以的。汉字的发展是简约律和区别律的相互作用的结果。可以简约部件,但条件必须是不影响区别。在这张清单中,“⺈(色字头)”与“冖(欠字头)”、“(风字框)”与“几(成字)”、“罒(罢字头)”与“四”、“覀(贾字头)”与“西”、“七(化字旁)”与“匕”、“(见字底)”与“儿”、“冂(同字框)”与“(周字框)”,这些部件,不合并也易致混淆,还不如干脆合并,也省得一点记忆。不过,有的部件,尽管结构、笔画都相同,却不能合并,例如“土”与“士”、“孑”与“子”、“”与“已”……等等。还有个别部件如“”,是否还可以拆为“”,“兆”,可不可拆为“、儿”,都需要讨论决定。

三、汉字拼形字母系统建成的经验

(一)汉字编码的目的是为汉字排序

过去的排序是为了检字,检字的目的是为了理解字义和构词方法。我们从来没有把排序检索当作基础教育课程,使之普及全民。现在的排序是为了使用计算机的速度来检字,检字的目的是为了用字,沟通信息。因此,计算机汉字输入的前景,明确地表明它必将进入基础教育,而且首先是汉字的序性教育。世界上没有哪一个拼音文字是需要编码的,因为它们都已经有了序性;汉字如果是有序性的文字,我们在电脑上使用它,也就不需要编码。把编码的目的当作只是为了输入,实质是使严谨的科学研究庸俗化。王永民先生就说过:“计算机汉字编码输入法的设计,常常用不着考虑倒回来作汉字工具书的查字法。”(3)这个观点,实际是背离汉字编码的根本宗旨。这种观点普遍流行,使语文界以及文字应用的行政管理部门不敢插手汉字使用的评论和管理。现在虽然已经看到了一些批评文章,但人们觉得它姗姗来迟,为时太晚了。当前的“普天之下,莫非王码”的局面已经形成,不是几篇无力的空喊所能制止得了的。

汉字编码的设计,是为了使汉字带上序性,而不是使计算机打出汉字。这是编码设计或评测的关键。

(二)“拆字编码”展示了汉字的变革

世事“合久必分,分久必合”,汉字的发展也应着了这个的运动规律。“拼形”拼了五千年,拼成了五六万个汉字,走过一个漫长的历程。从来不水较书写速度的中国人,碰上了高速使用文字的时代要求。人们在不断的实践中摸索出:汉字只有拆分为部件,并取得一张具有可使用性的部件清单,才能适应自身的生存。

可以认为,当形码的设计在汉字的拆分面前手足无措的时候,几乎所有的设计者都采用“优选”部分部件以避开拆分的麻烦,只有陈爱文先生指出“汉字编码是汉字的辅助形式,它将成为中国文字的第二种形式。”“它把方块形式的汉字变成线性形式,而且具有序性,电脑需要这样的文字,字典需要这样的文字,信息化的时代处处需要这样的文字。”(4)从而拨开了笼罩着编码界上空的浓浓迷雾。

汉语汉字都不适应计算机技术应用的要求,这是一个严酷的现实,人们才开始了“拆字编码”的尝试。从笔形码的“一分为二”,字根码的“优选”,到表形码部件清单的出现,“拆字编码”总算走到了尽头——汉字拼形字母系统构成了。令人遗憾的是,这些不断的实践并没有使学术界理解“拆字编码”是当前人们对汉字变革所作的新尝试,应该进行认真的探讨。

人们没有理解“拆字”的实质就是把“方”的拆成“长”的,使方块汉字成为线性形式,就是让每个部件在汉字中显示它的序位。拆字拆出了汉字的线性,拆出了汉字序性化的第一步。拆字编码展示了汉字的一次历史性变革,我们的语文界应该认真面对它。

(三)“拆字编码”拆出了汉字字形的序性化

汉字的线性形式,不是汉字字形序性的全部形式。把汉字拆成部件,部件按第一个笔画出现的先后排列,每个部件在具体汉字中就形成了固定的序位,这只是汉字序性化的第一步,也可以认真是必须先具备的一种形式。所谓汉字序性的全部形式还包含通过映射使每个部件都有一个序性代码;在此之前部件还必须以一定的规则进行分型分类,部件清单中的每个型和类,以及每个类中的部件都要有一定的序位,这样才算是汉字真正实现了序性化。

“拆字编码”拆出了汉字序性化,有效地迎接信息时代的挑战却被某些人认为是误区,这“萍末之风”没有被察觉。因为,编码商品化的大潮涛声震耳;编码专利的黄金梦酣声如雷;拼音化的协奏曲——“一语双文”调高音嘹。人们看不见这如烟如缕的拆字“微波”,听不到这如啸如吼的部件“次声”!用字形载负中华民族文化信息的汉字,也必须能以其全部字形信息来回答信息时代的挑战。

(四)超越误区才能建成新学科

我们通过给部件定义,确定拆分原则和部件清单,归纳出拆分规则和整理出部件的分类系统,同时进行了部件类和部件的排序,使每个部件类以及每个部件,都有规定的序位,有利于学习和记忆。

现实使人迷惑,在热火朝天的汉字编码“发明”的大潮里,信息界把编码看作一种使计算机打出字来的技术,却无视它的发展,无视全国统一网络的建成,无视它将进入中小学教育的前景;语文界似乎在隔岸观火,好像这种活动与他们无关,有人甚至觉得这是一个实现拼音化的好机会。因为,像五笔字型这样的形码,还有大从码、郑码、钱码等等,都无法解决汉字拆分的难题,把汉字拆得一团糟。他们认为,这完全是拼音化太迟之故。到1993年,汉字编码在“速度误区”里已经热闹了七八年,全国第二届计算机语言学联合学术会议,语言界到会的还只占总人数的20%,而在国外,这类会议是以语言学家为主的。“1986年全国汉字编码评测出的A类11个方案中,只有两个方案是语文界搞的。”“国内外700多种编码方案中,语文界真正搞成的寥若晨星……”。这种态度,当然会使人认为“语文现代化的主要障碍,首先来自语文界本身”。(5)

因为解决汉字的拆分问题,本就是语文界的事,为什么不闻不问。1994年,语文界步履蹒跚地成立了语文现代化学会,人们期望它能踏踏实实地指导汉字现代化的实践,可是却让人看的是一个遥不可及的汉字拼音化的寄望——“一语双文”。“一语双文”只是一种等待实验的寄望,是解决不了现代应用的“画饼”,它无法付诸实施,以应付现代科技使用。语文界并未发觉语文现代化首先是汉字应用的现代化,迫在眉睫的是解决计算机汉字输入的全面统一,而“一语双文”是行不通的。只有实现了汉字输入的全面统一,我国社会才能逐渐进入信息化时代。“字”是“语”的载体,是实现“语”的现代化之舟。那么不先使这只“舟”现代化起来,岂能渡向现代化的彼岸?不首先认真研究“字”,而高呼“语文现代化”,岂非缘木求鱼?当务之急是解决汉字的计算机输入的规范化和全面统一。短短的十几年时间里,电脑从PC机到奔腾机,整整换了四代,而语文界还在原地踏步。现在还把汉字输入的希望寄托于拼音化,寄托于语言现代化,语言救国论者将走向他们愿望的反面:使信息高速公路的建成放慢速度。扭转这种不正常局面的唯一办法,是开展对汉字编码基础理论的系统性的研究,找出汉字字形结构的客观规律。

我们历时十余载的研究,论述了汉字编码设计发展的历史,消除了人们一百多年来汉字现代化的迷惘;提出了从拼形造字到拼形文字的新观点,确立了汉字拼形化的信念,旨在建立汉字编码设计学的理论框架。这是一条漫长而曲折的道路,在众多学术界同仁的共同努力下,我们总算有了一个良好的开端。概括走过的路,我们终于得到一些较前深刻得多的认识。字根编码的难学、难记,又加上出了一系列拆分上的不规范,使一些企望拼音化的学者们误认为只要是“拆字编码”,就会把汉字拆得一塌糊涂,将会造成汉字规范的灾难。然而,我们却认为,“拆字编码”就象从花果山那块顽石里迸出来的孙大圣,把编码评测界和文字学界安静的天堂秩序搅得乱糟糟,也闯出了成“正果”之路——一条汉字现代化的新路:汉字编码(键盘)输入法;又以汉字发展的历史经验,证明拼音化是当前汉字现代化的误区。“拆字编码”一点一滴地从每个编码应用实践里吸取成功的信息,建成了自己的完整体系——汉字拼形字母系统;我们充满自信地预言:这一系统将在基础教育、社会应用中与汉字拼音字母系统并行不悖,使汉字跟上现代信息社会应用要求的步伐,并在中华民族今后的历史上,发挥它的“裂变能”和“聚合能”!只有超越误区,才能建成新学科,这就是汉字编码的历史经验。

 

参考文献:

1)康马杰:《美国精神》第139页、146页,光明日报出版社,1988年4月。

2)罗家伦:《历史的先见》第55页,学林出版社,1997年1月。

3)王永民:《汉字字形编码的原理和实践》,载《汉字编码参考资料》317-318页,中国中文信息研究会汉字编码专业委员会编印,1983年1月。

4)陈爱文:《汉字编码的理论与实践》第1-3页,学林出版社,1986年8月。

5)李硕:《中文信息和语文现代化》,载《中文信息》1994年第3期。  

 

附录一  汉字拼形字母系统教程 (暂缺)

附录二  ISO/IEC   DIS  10646 汉字集20902个汉字补充部件  (暂缺)

 

《汉字编码设计学》目录

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有