湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

 

汉字易拆易学证

 

潘德孚

  

拼形文字这个概念是1982年由胡乔木提出来的。他当时面临计算机的中文应用,认为文字改革的方向应该是把汉字改革为一种拼形的文字。

本文既证明了汉字是一种拼形文字,又证明了汉字的易拆易学。其方法是把仅占一级字库汉字中16%的、由两个部件拼起来的629个字,先一分为二。因为,二部件字是最容易拆分的。拆分出来的这些部件,经过分析,其组字频度已占一级字库汉字部件的95%。就是说,学会了629个二部件字的拆分,就等于学会了全部汉字的拆分。由三个以上部件拼起来的字,占一级字库84%。它们基本上都是由二部件字中的部件相拼而成的。其中需要增添的部件,其拼字频度仅占5%。因此,学会629个二部件字的代码,也就等于学会了95%汉字的代码;学会了这一部分汉字的书写,也等于学会了95%汉字的书写了。就此说明:汉字既易拆又易学;也说明,汉字就是由部件拼起来的拼形文字。

一、关于汉字难学论和汉字编码枷锁论

 

许多人曾经为汉字是否难学这个问题,争论了一个世纪。自微机出现以后,字形编码兴起,汉字难学论者有了一个新的理由:汉字难拆论。因为难拆,学习困难,于是又来了一个汉字编码枷锁论。说汉字编码是汉字输入的枷锁,成了汉字输入的累赘。这个讲法当然是很勉强的。因为,谁都知道,全国几百万专业打字员靠字形编码把不知多少数据输入了电脑,支持了我们的信息事业。所以,从逻辑上来说,这个道理不能成立。为什么一些语文学者就这么奇怪,许多不能成立的道理,到了他们口里,都会变成了有理的?该说是牵强附会,还是说强词夺理?学术研究到这个程度,实在是个不幸!

清末有位文字学家王筠,写了一本《文字蒙求》。他在《序言》中写道:“人之不识字也,病于不可分。苟能分一字为数字。则点画必不可缺,易学而难忘矣!”看来,王筠先生也是一个汉字难学论者。这不奇怪。王先生所处的那个时代,正是汉字落后论兴起的时间。但王先生不愧于一位伟大的文字学家。他虽然说汉字难学,但却提出了一个有先见之明的解决汉字难学的正确方法:“分一字为数字”,即把汉字拆分为部件。相比之下,现代的“枷锁论”者,确实与他差得太远了。他们在研究领域兜了一百年,看起来不仅没有前进,反而倒退了不知多少。这个问题值得深思。

汉字拆分为部件,不仅解决了汉字编码的难学,也解决了汉字的难学。去年11月,笔者在温州举办过多期汉字编码学习班,来参加学习的大多数是50岁以上的中老年人,其中60岁以上的占三分之二。我这个学习班就叫做“拼形码中老年学习电脑打字速成班”。我想,现在编码很多,有“万码奔腾”之谓,还有“五分钟学会”、“见字就能打码”等等的自我宣传,但就没有敢说让中老年速成的。因为,大家都知道,老年学编码不好办——健忘。说了就忘这是个通病。如果没有特别易学易记的方法,年过半百的人是很难接受的。我办了这几期学习班后,现在好多人都在电脑上转悠,逍遥自在了。66岁的卢声亮同志(温州市老市长),曾学过好几个编码,都没有学会。后来我给他一本拼形码课本,他自己学会了。今年他已73岁,特意写了一篇《以计算机换笔》的文章,刊在温州老年大学的学报上。大年初,有位60岁的何彩莲女士打电话向我问好,说自己在去年年底自学了拼形码课本和软件,已经在家里写她的家史了。由此可知,编码已经不再难学。

华师大教授曾性初先生,写了一篇《汉字易学易用证》,举了许多例子来证明汉字不仅易学,还容易使用,比拼音文字要好。后来,他受到不少攻击,攻击的理由无非是说他的资料中有几个例子未落实。他写这一篇文章,当然里面会有许多资料。而且某些资料之中一些话,也许写的人没有说得太死,引用的人都是按照自己的设定来理解的。反对者也可以用另一个角度理解它。所以,就出现了“以子之矛,攻子之盾”的现象。曾先生用实践的事实来说明汉字并不难学,但是,人生是那么短暂,已经为汉字难学的思维定势所缠绕的学者,总还想找一些茬子。笔者认为“堡垒是最容易从内部攻破的”。本文就是运用部件清单,来说明汉字不难学的内在道理,以“攻破”汉字难学论和汉字编码枷锁论。  

二、关于“拼形文字”这个概念

 

现在还有好多人仍然说汉字不好、落后,主张改革;一些人则说汉字好,是最优秀的文字。就我的想法,文字无所谓好或不好。你说汉字不好,世界上有十几亿人在使用它,并且如此得心应手。什么叫得心应手?就是不管你需要传递什么信息,它都能应付裕如。现在计算机来了,它同样工作得很利索,没有穷于应付的迹象。你说汉字好,有人认为使用形码,则难学难记,还有个拆字的规范损害问题。使用音码,一来工作效率差,需要看屏选字;二来读音的局限性太大,只能打常用字,罕用字就难办了;三来还有个中老年该怎么办不好解决。总之,说不好的人想改革汉字为拼音文字;说好的人要抵制这种改革。主张改革者无非是认为民族的落后是汉字难学造成的,想进步就得改革。这种思想本无可厚非,至于能不能成功还须假以时日,等待历史实践来证明。不想改革的人认为几千年的文化都是由汉字积累起来的,改革了岂不让文化断层了。保护历史文化也没有什么错。从使用的角度来看,整个汉字应用的时空中,既然有很多人使用它,那么它就像耕田的犁,会越用越锋利。道理在于使用的人有这么多,大家都想越方便越好,实际就是在不自觉地、不断地在改进。但这种改进的时空跨度太大,而且不以人们的意志为转移,我的认识是不应叫改革,应该称之为变革。

我研究编码后再研究汉字,我发现汉字系统中蕴藏着鬼斧神工般的规律,根本令人想像不到。却不知为什么有这么一大帮人在诋毁它。如果说不知者不罪,可却都是打着专家的牌子的。数量不大,影响不小。就我的研究,我认为,汉字落后论、汉字难学论、汉字难拆论、汉字编码枷锁论等等,统统都错了!汉字是永远改革(拼音化)不了,也诋毁不了的。看眼前,就没有一位主张改革的积极分子愿意使用拼音文字写他的文章,这就是一个很严酷的现实。什么叫现实?现实就是摆在眼前的证明。学术讲究严谨,不能睁眼说瞎话。

笔者在《汉字发展的宏观规律和汉字变革的基本特性》一文中已经说明文字是因应用而产生、存在和发展的。许多人都说汉字不好、落后,要拼音化,也造出了汉语拼音文字,可就没有人使用它们。就是说,没有一个人敢使用它们。那么,它们就没有存在和发展的条件了。所以,尽管许多人大骂汉字不好,大喊大叫,几乎闹得人人耳聋,热闹了近一个世纪,结果是什么?光听雷声,不见雨点(不是大小的问题)。文字是传递信息的工具。这个工具是所有使用者共同约定的。写文章的人必须要求看文章的人看得懂。如果别人看不懂他写的文章,他的信息就不能传递给别人,那么写文章的目的和意义就丧失了。天天写文章,天天用汉字,天天骂汉字不好,那我想,你们就干脆不要用汉字好了!记得白罗释的《说宛》里有句话的意思是说,一种德行,如果被极端化了,那将是一场大灾难。

20世纪初期汉字落后论产生,到50年代形成高潮,为什么只闻楼梯响,不见人下楼?是因为这个汉字使用的人群确实太大了,现在只有几个专家想拼音化,十几亿使用者不予置理,只管自己使用,最大的“力气”也扭不过这样的“大腿”。于是,有人就想期待让计算机来“废除”汉字。这个梦想当然更省力气。80年代在黑龙江成立文字改革学会,只能够算个尾声(在《当代的文字改革》一书中说这是个“高潮”),因为此后“文字改革”这个牌子也没有人愿意使用了。2001年的《国家语言文字法》的公布,应该说已经给汉字落后论划上了句号。我这些说的似属多余。问题在于如果我们不把难学难拆的道理摆清楚,我想,拼音化论的死灰复燃还是存在着它产生的基础的。

1982年胡乔木在文字改革委员会上说要把汉字改革成拼形文字,这无疑是开始了对汉字拼音化的否定。究其实,汉字本身就是一种拼形文字,既不需要改革为拼形文字,更不可能改革为拼音文字。拼形文字这个概念是离开“六书”,专门从汉字的字形结构形成来考虑的。这给汉字拆分为部件提供了的前提条件。许慎的“六书”说是从汉字形成的意义上给造字法分类的。唐兰先生改为三书也没有“离其宗”。因字形编码的需要,“部件”这个命名产生了。这个命名是从机械学中引进的,它摆脱了字义和字音,使字形“独立”出来了。其意义与部首、独体是不可等同而论的。

拼形文字这个概念的提出是很有实用意义的。后来郭冶方先生在汉字编码委员会上肯定了汉字是拼形文字。从胡乔木先生“改革成拼形文字”,到郭冶方先生肯定汉字是拼形文字,是学界一次认识上的提高。也可以说是汉字编码的需要逼出来的。本文则是以以汉字的拆分来证明“拼形文字”这个概念的正确。虽然,这个问题笔者已经在上篇里论证了汉字是由部件之形,拼成汉字之形的。现在还需要拿出数据来。

说汉字难拆,其实汉字不难拆,主要是还没有发现它的拆分规律。汉字是拼形文字。它的字形是拼起来的,可拼就可拆。从什么地方拆开?那当然是从拼起来的地方拆开。我已在《论汉字拆分的系统性》里提出“间隙拆分”的原则就成立了。因为“拼”,才产生了间隙。就好比搭积木,两块积木之间,就存在着间隙。 

三、关于间隙和部件的整体性

 

如果没有部件的定义,拆分就没有依据。笔者在《论汉字拆分的系统性》中已经提出了部件的定义,定义指出了部件的两个基本属性:相对独立性和可分离性。例如二部件字。即指一个汉字是由两个部件拼起来的。这两个部件在汉字中就产生了相对独立和可分离的两种属性。是什么原因使其产生的?当然是间隙。所以,间隙拆分,一目了然,是最方便的事了。从间隙处拆分,符合认知心理,拆分就有了可接受性。在确定部件时,抹杀间隙拆分,无视拆分后心理上的可接受性,随意乱拆,乱拼,都不符合汉字构成的规律,是造成汉字拆分困难的原因。

但有些字尽管没有明显的间隙,拆分时心理上也能够接受,这也是因为仍然有一种隐性的间隙存在。显性间隙可以一目了然,隐性间隙需要分析它存在的原因:

    (一)笔画走势是造成两个相对独立的部件产生隐性间隙的原因。例如“亦”,其上面的“亠”与下面的“”,上为横笔,向左右方向走,下为竖撇和竖钩,向上下方向走,因此形成粘连,看不见间隙,但人们能够很自然地接受它的拆分。

    (二)两个成字部件相拼造字,因笔画走势造成相接,读音和字义使人们觉得它们是相对独立的,帮助了我们从心理上理解并接受它们之间存在着的间隙。例如“古”,上面的“十”与下面的“口”,虽然粘在一起,但都可以读出来,所以很容易接受。

    (三)一字中含有一个成字部件,使其与另一个非字部件也同样具有相对独立性,例如“占”。“占”字下面的“口”,结构简单,自成一块,尽管“”与“口”粘在一起,也能够使我们从心理上接受它们之间的间隙。

(四)尽管两个都是非字部件,例如“击、农”,都内含的两个部件,“、凵”、“”,字中的部件属于两种不同的笔画结构形式,也能够使我们从心理上承认它们之间存在着间隙。

(五)部件的可移动性能够使我们接受这种隐性间隙的存在。例如“己、已、巳”,由于“”在“”的竖笔上的位置移动而产生了三个不同的字;再如“赤、亦”,就好比部件“”,在“土、亠”之间移动,与“土”在一起,则成为“赤”,与“亠”在一起,则成为“亦”。

隐性间隙的存在说明拆分不可完全依据显性间隙。同时说明汉字部件存在的支撑点还有另一处:笔画结构。

几个相离的笔画会被承认为部件而不能拆分为笔画是什么道理呢?这就是笔画结构。这些相离又相互依存的笔画聚在一起,有的是成字部件,例如“八、二、三、六、小、川”等等,有称说,聚在一起参加拼字,使人们产生了一种不可分的感觉;有的虽然没有称说,它们的笔势也会使人有一种聚合的感觉,例如“”等。在我们拆分“泣”字 ,一般都认为只能拆为“氵、立”,为什么?正如陈爱文先生所说,这些笔画具有“内聚”的性能。“内聚”是一种感觉,是主观的感受。这种感受,自然也来自客观的结构。

汉字之所以容易被拆分为部件,皆是因为部件也是一个整体,是一个由笔画结构构成的整体。它含有整体性。两个整体性的东西放在一起,自然就会有一种相对独立的、可分离的感觉。

整体性是抽象的,它会因具体人的具体条件而有不同的解释。例如长期受许学影响的文字学家,会以为独体就是部件;或以为部首就是部件。有人把“”看成一个部件,有人却说不是……因此,我们必须对整体性加以分析。

这种整体性使我们在汉字结构中把某几个相离又相聚的笔画看成为一个整体,把另外的几个笔画结构看成是另一个整体。例如“三”,是三个相互分离的横笔,可以被当作一个部件,即一个介于笔画与成字之间的中间层次,谁都不愿意把它再拆分,例如“兰”,要拆为“丷、三”,它也符合上面所说的“两种不同的笔画走势”这个道理。

对部件整体性的认识,在人们心理中形成的原因虽十分复杂,但它的表现却不外于:

(一)部件自身结构上的整体性,例如“粼、临”。“巜”只能拼一个“粼”,“”只能拼出一个“临”。尽管它们的拼字量少,但它们在汉字结构中与其它部件相互分隔,自身又形成一种不能拆分的“块感”。

(二)部件的组字频度形成的整体性,如上所述的几个相离的笔画,或是组字频度高,常常一起组字;或是具有相同的笔画走势,造成一种聚合的感觉。 

 

四、汉字易学易拆证——国标一级字库拆分后的分析

 

古人造字,由简单到复杂,必然先造象形的独体字,后用独体相拼造出会意字,或指事字。然后再由独体字、会意字、指事字相互拼合,造出新的字。这就是说,古人造出了独体字后,不管要再造什么字,从字形的角度来看,只有一种方法:拼形造字法。会意、指事、形声,都是形与形相拼造出来的。由简单的,拼成复杂的。

部件清单中的352个部件,其中的“事、乜、凹、凸、毋、曲、孓”等7个不能拼字除外,余345个都能拼字。因此,我们在下面的计算比例中,只能按后一个数字。

用我们的部件清单分析了国标一级字库3755个常用字,得到下面这个数据(具体字例,请参阅潘德孚、詹振权《汉字编码设计学》第153~179页,中国城市出版社,199711月):

单部件字(即成字部件)111个;

二部件字,629个,含部件244个;

三部件字,1249个,增含部件73个;

四部件字,1068个,增含部件15个;

五部件字,489个,增含部件3个;

六部件字,160个,增含部件2个;

七部件字,39个,增含部件1个;

八部件字,8个;

九部件字,2个。

二级字库3008个字,仅增加拼字(即组字,以下不再注明)部件8个(巜、、孓、乜、)。还有“入(在二级字库中可拼字)事、曲、毋、凹、凸”六个部件不能拼字。

629个二部件字,每个字都是由2个部件拼起来的。它们仅占一级字库总字数的1675%,但却已经含有244个部件,占拼字部件总数70.93%强。几乎囊括了全部的高频拼(组)字部件。三部件字1249个,字数虽比二部件字增了一倍,却只须再增用73个部件。而且,这73个基本上都是使用频度不高的部件。据统计,只参拼了156个字,仅占12.49%。这等于说,三部件字中的1093个字(占87.51%),使用的、绝大多数的二部件字都是原封不动地增加了一个部件而变成了三部件字的,例如“沽、咕、舌、诂、故、估”等,都是“古”这个二部件字增加一个其他的部件拼出来的,学会了“古”这个字,就等于同时学会“沽、咕、舌、诂、故、估”等字中三分之二的部件,它们的拆分,更不用说了;其中 一部分则是重新组合拼出来的,例如“岸”,“山、厂、干”都是二部件字中已经拼过字的部件。撂下这87.51%不说,那12.49%156个字中,有大部分仍然是属于二部件字中已经使用过的部件。因为,每个字使用了3个部件/字,应该使用的是468部件/字(每个部件拼字一次,称为1部件/字)。可是新增部件的使用只有156部件/字。余下的312部件/字仍然是二部件字中的部件。就使用的部件/字来计算,二部件字中的部件,占三部件字中组字的部件95%。就是说,在我们学会了二部件字后,凡是三部件字中的部件,也同时掌握了它的95%。所以,学会了629个二部件字的笔画顺序、部件结构和代码,就等于立即学会了95%的三部件字中的部件笔画顺序,掌握了它们部件和代码。至于四部件字,那就更不用说了。1068个四部件字,除掉二部件字和三部件字中已经使用过的部件,只增加了15个部件。这15个部件,只能参拼23个字,按使用的部件/字来计算,仅占四部件字总组字频度的0.05%强。

由是观之,只要学会(笔画顺序、拆分、编代码)629个二部件字,就等于掌握了95%以上的汉字的书写顺序、拆分和编代码的方法了。其实,就拆分而论,这个讲法还是打折扣的。因为,实际的汉字拆分过程是这样的:在三部件字中,我们碰到一个陌生的部件,其他的两个部件我们在二部件字中已经熟识了,难道还怕这个陌生的部件拆不出来?就好比三角形的三个角为180度,已知两个角,难道不知道第三个角?四部件字的道理与上述相同:知道了三部件字的拆分,拆不出四部件字中的第四个部件是没有道理的。所以,只要知道629个二部件字的拆分,就能百分百地拆分每一个汉字;学会二部件字的编码方法,就已经知道百分之九十五的汉字中的代码;学会二部件字,也等于记住了百分之九十五汉字的结构。这证明:汉字不仅易拆、易学,连汉字编码也是很易学的。古人之所以追求汉字的字原、字素,也是想能够彻底拆分汉字。由于时代条件的限制,到现在才被发现。

二部件字、三部件字、四部件字再加111个单部件字,合在一起,共3057字。占一级字库3755字的81.4%。就字库来说,这一部分是最常用的;就部件组合级次来说,二部件字不仅是最常用的,它们的部件拼字频度也是最高的。所以,说汉字难学,难拆,汉字编码难学,岂不是一起大冤案?

上述的“二部件字、三部件字……”等等,是根据三个条件确定的:一、部件定义;二、部件清单;三、拆分规则。

一、部件定义:部件是汉字中相对独立的、可分离的笔画结构块或基本笔画。

二、部件清单,根据以上定义,可从国标二级汉字库的6763个汉字中,拆分出352个部件,具体清单见《汉字编码设计学》(中国城市出版社,199711月)

三、拆分的原则和规则:

拆分的原则有三:

1、间隙拆分;

2、部件不拆;

3、基本结构不拆。

拆分的规则有六:

1、相离不拆,成字部件优先,多笔部件优先;

2、相交不拆,“内、臾、”例外。长点例外,如“匆,啄、斥”等要拆开。

3、附在部件上的单独撇笔一律拆开,包括“必、耂、”。由撇笔组成的部件不拆。

4“戈”字类部件,其横笔向左伸长,上下有其他笔画相交或相接的,该横笔一律左右两用。

5、形成包围不拆,包围框内的粘连笔画不拆,粘连于包围框外的笔画结构块或基本笔画要拆掉;包围框内的单独点笔都不拆出,如“母、丹、  ”等,只有“叉”字例外。

6、形成字架不拆;中间一竖,两头有单个横笔挡住的一律不拆,“丕、蚩”两字例外。

以上三个条件中,关键是部件的定义。

汉字难拆论在我国的语言学界广为流行,其原因在于他们对汉字拼音化还存在着天真的幻想,同时,不愿意认真研究汉字字形编码的丰富实践。北大教授苏培成先生提出的“汉字编码枷锁论”,就可以体现出这种幻想不能落实的情绪发泄,也说明他所领导的中国语文现代化学会是对字形编码的理论研究一无所知。事实是汉字的字形编码的计算机的中文应用,比之语音输入展现了很多优点,尽管这些编码方案都还不很成熟。它又带来这么一个信息:字形输入具有普适性,不必等到语音的统一(普通话的普及)。因为,语音统一在我们这样一个人口众多的国家,谁也无法估料到何年何月。而计算机的普及即在眼前,而绝大多数的知识阶层都还没有接受过拼音字母的教育,即使有的已经受过教育,也因为没有使用而忘记了。字形编码的应用,不仅证明它有着语音无法替代的优势,还为实现全国统一的字形规范带来希望。  

 

附件1:
谁能说这些字不好一分为二(拆分)?
 
一、629个二部件字清单:
 
艾 安 盎 扒 叭 巴 白 百 半 办 邦 蚌 杯 悲 辈 背 贝 备
苯 比 币 必 边 秉 卜 布 步 才 采 灿 仓 曹 叉 产 昌 巢
扯 尘 忱 呈 承 池 弛 耻 尺 赤 冲 抽 仇 初 出 床 垂 春
纯 此 刺 从 寸 达 打 呆 歹 代 单 耽 旦 当 灯 邓 迪 狄
地 典 佃 甸 刁 吊 盯 叮 鼎 订 东 冬 斗 毒 独 杜 肚 队
吨 囤 多 朵 厄 尔 洱 伐 凡 反 犯 方 菲 啡 飞 匪 诽 肺
沸 分 奋 风 奉 凤 佛 否 肤 扶 拂 甫 父 妇 杆 柑 肝 冈
肛 杠 个 各 革 耕 更 庚 攻 耿 功 公 共 勾 古 蛊 骨 官
圭 归 龟 轨 柜 酣 邯 旱 汗 汉 夯 好 号 禾 黑 虹 弘 红
划 化 户 怀 坏 环 还 患 宦 幻 灰 回 卉 惠 汇 讳 伙 击
圾 机 肌 讥 姬 吉 极 棘 汲 级 己 计 夹 家 加 尖 间 奸
茧 见 江 建 讲 交 叫 节 杰 姐 戒 介 届 斤 津 仅 进 纠
韭 久 酒 旧 狙 疽 咀 沮 拒 具 句 炬 抉 决 诀 军 君 刊
开 扛 亢 棵 可 课 肯 孔 扣 库 块 快 匡 狂 旷 亏 拉 坤
泪 困 扩 垃 来 阑 兰 肋 厘 狸 理 李 礼 栗 历 哩 隶 连
疗 辽 林 灵 另 卢 吕 仑 罗 裸 马 埋 麦 毛 么 玫 枚 眉
每 昧 妹 闷 们 孟 米 面 苗 庙 灭 免 民 闽 明 名 沫 抹
尼 某 拇 亩 姆 奶 男 内 年 宁 牛 农 弄 奴 疟 偶 排 沛
朋 匹 皮 平 妻 其 祁 乞 企 气 泣 千 浅 欠 巧 栖 切 亲
沁 青 庆 丘 囚 酋 区 蛆 犬 权 取 去 全 劝 炔 让 壬 仁
认 刃 扔 仍 戎 茸 冗 如 汝 闰 洒 扫 杀 晒 珊 杉 删 衫
闪 汕 勺 少 社 呻 伸 绅 神 沈 审 声 生 升 石 圣 师 失
什 矢 使 式 示 仕 氏 市 收 手 书 术 水 甩 帅 双 思 巳
宋 速 肃 虽 岁 孙 他 它 她 坍 台 太 叹 桃 逃 体 屉 天
挑 条 眺 厅 彤 童 汀 歪 头 吐 妥 袜 丸 万 汪 亡 枉 旺
苇 违 吾 围 伟 纬 味 胃 位 卫 文 闻 问 无 午 伍 戊 勿
务 昔 吸 汐 戏 细 匣 下 仙 闲 县 线 相 乡 肖 泄 芯 辛
杏 兄 凶 休 朽 袖 旭 轩 玄 旬 穴 血 巡 训 押 丫 牙 炎
奄 羊 阳 耶 舀 姚 要 业 叶 伊 胰 宜 姨 已 艺 亿 亦 忆
义 因 音 阴 引 印 英 映 庸 永 用 尤 邮 油 有 友 右 幼
迂 盂 愚 隅 予 雨 与 禹 宇 羽 玉 芋 吁 遇 寓 元 云 匀
允 孕 匝 杂 灾 再 枣 早 灶 扎 札 轧 栅 闸 乍 盏 栈 占
杖 仗 找 召 枕 阵 争 怔 政 汁 之 证 症 轴 支 直 址 只
旨 志 炙 盅 忠 肿 重 仲 舟 宙 朱 逐 烛 拄 柱 助 蛀 庄
专 住 注 拽 妆 壮 浊 孜 仔 自 字 祖 诅 阻 组 罪 左
 

 

二、二部件字所含有的244个部件及其分类  

 

 

 

三、三部件字(以下部件例字,可查看《汉字编码设计学》
157~166页)需要增添的部件,合计73个,其拼(组)字频度统计如下:
 

 

 

附件2一级字库3755个常用字中

二部件字中244个部件组字频次表

  

  综上表所统计,一级字库3755字,一共使用了344个部件(二级字库3008个字只增添8个:巜、、孓、乜、),合计使用部件13147次。其中含二部件字629个,占总字数仅1675%,其部件数却拥有244个,占一级字库拥有的部件总数70.93%;合计其部件组字频度占95.07%。(本表前92个部件,组字31次以上,总组字量为10971次,组字频度占8345%。后152个部件,总组字量1528次,占1162%。)因此可知,汉字是从少数的象形文字,经拼合而不断增多。最早拼出来的就是这些二部件字,然后再利用这些二部件字,拼出新的字符;也不难理解,其中有的象形文字,由于图形复杂,在演变的过程中,分解为两个以上的笔画块,这些笔画块,也参与了拼造汉字的活动。因此,构成了庞大的汉字系统。

  二部件字中部件使用频次统计说明:从单部件字,到二部件字,到三部件字,这个向上递增的过程,是汉字拼造发展增多的趋势、过程和规律。由此可以证明:汉字是一种拼形文字,不仅易拆,而且易学。

 

下册

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有