上载日期:2005-09-29
楷书字形的几何结构——大白话之一
规范汉字的部件规范问题——大白话之二
方块形表意汉字的理据——大白话之三
楷书字形的几何结构
——大白话之一
字形是汉字三要素的基础,是字意字音的依托。然而,从古至今的文字学家多重视《说文》“分析理据”,很少涉及字形的研究。“皮之不存毛将焉附”,真是一语破的。所以脱离字形的理据分析和依此制定的《汉字部件规范》,对于现行汉字的拆分编码,没有达到预期的效果。
组成单字的最小单位是笔画,组成单字的基本单位是部件。部件由笔画组成。少数单字只一个部件组成,多数单字是二个以上部件组成。在书写习惯上,词语中的单字可以分行书写;单字中的部件或部件内的笔画,不能分行书写。这是为什么?因为笔画或部件之间存在着约定俗成而不能随意改变的结构关系。这种关系表现在同一平面上,所以叫做几何结构。几何结构包括笔形、笔顺、笔画以及它们之间相交或相离的相对位置关系等。
部件内连续笔画之间、相邻部件的笔画之间,相交时的特征是,笔画上有交点,交点为共点时是直接相交,分为十字交叉和端点连接(丁字连接、口字连接)。交点不是共点时为间接相交(目中的两横之间、勿中的两撇之间即是)。
相邻笔画之间或相邻部件之间,相离的特征是,始终有一贯通的间缝。一侧是一点(寸、为),或与之笔顺连续而不相邻的短撇(半、平),各自与相邻笔画所形成的间缝为短缝,没有方向性。除此之外的间缝都是长缝,按照方向分为横缝、竖缝和横竖缝。
间缝的两侧都是没有交点的笔画而且又不是部首时,定义为单笔缝,即部件内相邻笔画之间的间缝(川心);至少一侧是有交点的笔画组或部首时,定义为部件缝。即单字内相邻部件之间的间缝(少决尽江相要)。部件缝的长度等于或相当于(有扩延空间可至相等)单字的宽度或(和)高度时是最长缝,记作一级缝,垂直于一级缝的次长缝,记作二级缝,依此类推
.
单字和部件的几何结构分类相同,都是四类:1
、无间缝结构——各笔画上都有交点(凸、果);2
、无交点结构——各笔画上都无交点(州、心);3
、短缝结构——交点和只有短缝,没有长缝(为、平);4
、部件缝结构——交点和至少有一条部件缝(长缝),例如:行、尽、江。此外,还可能有短缝(薄)、单笔缝(萧)。
习惯上按照一级缝的方向,将部件缝结构的单字体型分为三种:上下型,左右型,包围型。其实,少数单字的长缝和部件或笔画呈对称排布时,从方块形表意汉字的理据上说,不同于以上三种体型,特称对称型(乘器噩非燕率),即第四种体型。
多数单字的书写顺序是先上后下,先左后右,一个部件写完之后,才始另一个部件,叫作顺续式组配;少数单字是一个部件尚未写完,就写另一部件至完,再写前一部件至完,叫作间断式组配(褒乘医国可或衙)。极少数单字是省简式组配:两个部件相交组配时
,省简了笔画(戢局)。
相邻两部件之间的相交或相离关系,与其表意功能有何联系?一般来说,交叉结构表示合二为一,失去了各自独立的表意功能,组配成新的表意部件。所以约定俗成,权威性的大字典中不把交叉结构的部首作为检索部首;方块形表意汉字的理据上,也不把交叉结构的部首认作字源部首。因此十字交叉结构不拆分。部件缝结构表示分二不合,各自保持原有的表意功能。例如:暮(莫日),盒(合皿),鸿(江鸟)。所以长缝之侧的部首,最有资格是单字的检索部首和字源部首。丁字连接或短缝的结构可以看作是界于交叉和长缝之间的结构形式,彼此之间若及若离,模棱两可。所以在无间缝结构或短缝结构的单字中,丁交连接或短缝相离的部首,也可以作为检索部首或字源部件。例如:天(大)、古(十)。良(艮)。
少数宋体字与楷体字在上下相离或丁字相交的结构关系上不尽一致,例如“早、表”中,楷体是相离,宋体是丁交,其实已约定俗成为模棱两可。对于拆分编码来说,宁可认作是相离结构的部件缝。
方块形表意汉字的理据
——大白话之二
从古至今,汉字经历了漫长的、复杂的演变。但始终是方块形的表意文字。为什吗?回答汉字所以是方块形表意文字的道理和依据,就是本文提出的方块形表意汉字的理据。
从研究对象和分析方法上说,这里所谓的理据与文字学界传统的结构理据,在概念上完全不同。以前所说的结构理据,自称是根据字源或参考字源(其实是表意部件),从汉字的部件组合中分析出的造字意图。
分析象形文字的结构理据如同看图识字。例如:甲骨文、金文的“日”是园形,“月”是扁形,区别在于月有园缺。
由古文字发展为现行文字,汉字的形、音、意、笔画和部件都发生了沧海桑田的变化。现行汉字中的部件是不是造字之初的字源,谁也无法肯定。所谓根据或参考字源分析现行汉字的结构理据一说,不切实际。东汉时许慎已无法知道真正的字源,只好将有表意功能的部件主观认定是字源,套上《六书》的公式,解释单字的词意作为分析的依据。例如《说文》以“从日在木中”,解释“东”(繁体)字的理据是会意字。把话说得通俗点,这样地分析好像是拆字猜谜。后来的文字学家如法炮制,凡是部件的本意与词汇含义相近的单字,就认作是有理据;凡是部件的本意与词汇含义无关系的单字,就说无法分析理据,或形与源矛盾。无理据的单字还能算是表意文字吗?无理据的单字能传承至今吗?
两千年来汉字理据的研究,文字学界不绝争论,也许有学术价值,但无使用价值,外界无人问津。现在是信息时代,汉字编码时所拆出的部件,必须规范化,需要汉字理据的支持,这才引起了社会的关注。
对于个体(一个单字或部件)来说,演变是无规律的,但是,对于整体来说,变化是有规律的,这叫万变不离其宗。这“宗”就是:“古今汉字始终是表意的方块字”。造字要有理据
,演变要凭理据
,现行汉字岂能无理据?关键是怎样分析理据。可以肯定,根据部件猜揣造字意图的路子走不通,必须独辟蹊径。车到山前必有路,柳暗花明又一村。
字形的几何结构表明:在上下型部件缝结构的单字中,总是由宽度(横长)相等的部件构成;在左右型部件缝结构的单字中,总是由高度(竖长)相等的部件构成;在包围型部件缝结构的单字中,外部件的横竖笔画就是单字的宽度和高度。部件缝结构的单字约占所有汉字的95%,其它单字的构型也与此相似。由此可见,是汉字的几何结构决定了它为方块形的特征。
组字能力较强的部首部件,几乎都有清晰的表意功能,几乎都包含单字的首笔画或(和)末笔画,而且,这些部首的宽度(横长)或高度(竖长)无一例外地与单字的宽度或高度相等。这叫做“形的凸现特征”。无独有偶,在形上有凸现特征的字部件,多数有表音功能。无可讳言,还有些部首部字的功能不清淅,甚至没有这些功能。但是,它们也有形的凸现特征。无疑是它们在演变过程中失去了表音表意的功能。
形、音、意是文字的三要素,其中“形”是基础,是音和意的依托。而具有凸现特征的部件(一般是分别包含单字的首笔画或末笔画的两个部件)是构成方块形的基础。所以有理由推断:
一、部件具有凸现特征是当时作为字源的必须条件(因为汉字始终都是方块字)。
二、现行汉字中具有凸现特征的部件,不管是字源的传承部件还是演变部件,都是当时约定俗成的字源部件(因为汉字始终都是表意文字)。
换言之,不管部件的本意与单字的词汇意义(广意的,不是侠义专用的),相近还是无关;不管部件有无表意功能;不管部件是部首/部字还是笔画组,只要它形有凸现特征,都可以认作是现行汉字的即时(任何时候的当时)字源部件。这就是方块形表意汉字的理据。
如果部件是部首部字,表意功能与单字的词汇意义相近,认作是传承理据,如果部件是笔画组、或部首部字的表意功能与单字的词汇意义无关,认作是演变理据。但不是无理据。
汉字是大众文化交流的工具,遵从约定俗成的规律。有关汉字的规范或理据分析,都必须通俗化,大众才会接受,才可能行得通。从形出发,立足现代,分析每个现行汉字的理据,有助于教学认字,有利于拆分编码,人人都能无师自通,何乐不为?
规范汉字的部件规范问题
——大白话之三
“万马奔腾”践踏了规范汉字,形码的字根字元不是规范部件。文字学家开了一张规范部件的清单。学者潘德孚向权威提出了质疑:什么是规范部件?什么是不规范?应该有个客观的标准,权威哑口无言。踏破铁鞋无觅处,得来全不费功夫。规范部件就在规范汉字中,规范汉字中的固有部件都是规范部件。规范部件不用文字学家制定,更不是随意拆出的。
规范汉字中的固有部件都是规范部件,难道还有怀疑?质量达标的机器由标准件组成,这是不争的事实。好机器卸成了废品,是方法问题。形码的字根字元不是规范部件,也是方法问题。在没有理论指导的情况下,形码设计者根据编码的需要,随意拆分单字,如将“民”拆成(巳七),自造了一些“人工部件”,情有可原。但是,悖逆汉字规范的泛滥,不能放任自流。如不尽早尽快地消除不良影响,后患无穷。为此,国家语委请来的文字专家,没有达到预期的效果。
本来是缺乏理论而方法不对路的问题,对症下药不就迎刃而解了吗?可是,文字专家没有这样做,他们按照不为大众共识的结构理据,制定出560个基础部件,作为规范的标准。违背了“从形出发”“立足现代”的原则。形码设计无所适从,从而攘成汉字拆分为“雷区”的氛围。李格先生发明的逻辑二笔码,为避开拆字雷区,不得不以单字的首/末笔画为形码,致使重码较多的后果。《汉字部件规范》发布七八年了,响应规范做了自我修正的形码仍不见起色,不尿规范的形码(五笔字型)仍是市场霸主,更无按照部件规范的新码出现。对此,大家束手无策。国人无不为汉字编码徘徊不前而焦虑。
既然单字的固有部件就是规范部件,如果从单字中拆出的部件都是固有部件,也就都是当之无愧的规范部件了。因此部件规范问题,也就成了判断所拆出的部件是不是单字的固有部件的问题。
20902个汉字中有多少个部件,无关紧要。按照单字的组成来说,所有汉字的部件,不管是几百个,总不外乎这三种:部首、部字和笔画组的部件。当拆出的部件,都与《汉字统一部首表》中二笔画以上(不包括一笔画)的部首;或与《现代汉语通用字表》中的成字,在笔形、笔顺、笔画及其结构上完全一致,或仅有约定俗成(如成字作偏旁时:横改提,捺改点,竖弯勾改竖勾等)的改变时,就可确认是部首或部字的部件。它们符合国家规范,是无可非议的规范部件。第三种是包含可拆出部首部字的笔画组复部件,和不包含可拆出部首部字的笔画组简部件。笔画组的复部件和简部件现在都既不是字,也不是部首,无名称(不可读),没有规范标准。于是规范部件的范围,就缩小到了所拆出的笔画组部件,是不是单字固有的规范部件上了?
从几何结构上看,当相邻的两个笔画组简部件相交时,部件间的和部件内的交点,不仅在结构上难以区别,而且在功能上也没有区别(都不表意表音)。其实已合二为一个笔画组简部件,只不过是笔画增加了而已。换言之,笔画组简部件中,既没有拆分的标记,也没有判断拆分正确与否的标准,即不可避免拆分的随意性。要阻止随意拆分,别无良策,唯一的办法是笔画组简部件不拆分。如果笔画组简部件原来就是单字的固有部件,现在原封不动地作为一个部件,当然还是固有的规范部件。不包含部首部字的无间缝结构的规范单字(凸年面且两),如同不拆分的一个笔画组简部件,任何时候都是符合国家规范的单字或部件吗。
如果相交的两个部件中,只有一个是笔画组简部件,而另一个是部首或部字时,它们之间在结构上虽然难以区别,但在功能上有所不同。以此为据(存在分界交点),就能将它们分开。.例如,包含部首部字的无间缝结构的单字,“丙”要拆出一个部字时,只能是“内”,其余部分必定是“-”,“舌”要拆出部首部字时,只能是“千口”。无间缝结构的复部件,在一分为二的两个部件中,务必至少有一个部首或部字的前提条件下拆分,所拆出的部件一定都是固有的规范部件。前提条件限制了拆分的随意性,确保了拆出部件的规范性。
从复合固有部件中拆出一个规范部件后,剩下的笔画组部件肯定是一个固有部件。这个问题还可用小学生的数学公式证明:加数(规范部件)+另加数(单字中的固有部件)=和(无间缝结构的单字或复部件),和(可拆分单字或复部件)-加数(规范部件)=另加数(单字中的固有部件)。
例如3+2=5,5-3=2是唯一的标准答案。(1+1)也不是正确答案。
从几何结构上看,部件缝两侧的部件之间,本来就没有笔画上的瓜葛。切入部件缝拆分时,绝不会改变长缝两侧部件内的一切。因此,部件缝结构的单字或笔画组复部件,切入最长缝拆分时,两侧原封不动地作为拆出部件,不管它们是不是部首部字,无疑都是固有的规范部件:樱(木贝贝女),奉(
)。
短缝结构的单字和笔画组部件,几何结构上具有中庸性,可以切入短缝拆分,也可以打开交点拆分。前提条约同上:不论采用哪一方法,在一分为二拆出的两个部件中,务必至少有一个是部首或(和)部字的前提下,才能进行:良(
艮),亚(-业)。否则不拆分(为丹甫半)。
无交点结构的单字,数量很少,拆分简单:单笔缝不拆(心州),切入部件缝拆分(按照定义,一分为二时无疑能拆出部首或部字):沙(
少),洲(
州)。
从方块形表意汉字的理据出发,为使部件缝结构切入长缝逐次降级拆分的有序进行,每次拆成的两个部件必须是形有凸现特征的部件。一次拆出的两个部件都是部首部字时,无需考虑它们的组配方式,但只拆出一个部首或部字时,形有凸现特征的部首或部字必须是顺续式组配。换言之,每次所拆出的部件必须是单字或部件的“字源部件”。只有字源部件提供的编码信息才是体现单字(或部字)形、音、意的权威性信息。这样的拆分才能体现部件构成单字的严谨程序,逐次拆分才能有条不紊的进行。
综上所述,拆出规范部件的基本方法是:切入部件之间的间缝(部件缝/短缝)或打开部件之间的丁字交点,每次拆分为两个形有凸现特征的部件,其中要有尽可能多的部首/部字的部件:暮(莫日)、盒(合皿)、鸿(江鸟)、衷(衣中)、示(二小)、卖(十买)、乘(禾北)、衙(行吾)、舌(千口)。切入部件缝拆分时,拆出的两个部件中,有或无部首部字都能进行:奉(
);而切入短缝或打开丁字交点拆分时,务必至少要拆出一个顺续式组配的部首或部字的部件:天(一大)、产(立撇)、良(点艮)。否则,不能拆分:巨、凹、鬼、鸟、半。一言以蔽之,从形出发,尊重理据,由单字中拆出的部件,是部首部字时都是规范部件;是笔画组的固有部件时
,也都是规范部件。由拆分条件阻止了拆分的随意性。
逐次拆分的程序及末级规范部件的附加条件,留给形码设计者根据编码的需要自行设定。设定的基本原则,不仅仅是拆出的每个部件都具有规范性,而且每个单字的拆分结果要具有单一性。例如:王(-土)/(干-),章(音十)/(立早),都符合拆分要求。但是,每个单字的每次拆分,只能有一种结果。只有拆分有了规范性和单一性,才有共识性。拆分的共识性,也就是拆出部件正确与否有了检验的标准。从此,形码设计就无需选定编码部件,分组排布在键盘上了。操作者能够按照设定的拆分程序及末级部件的附加条件,从要输入单字中直接拆出编码部件,现拆现用。这样不仅没有死记硬背的苦恼;而且,想要编码的汉字范围不受样本字库的限制。从此,根治了形码画地为牢(圈定编码部件)和难学易忘(死记硬背)的顽疾。以前出台的形码、形音码,所以必须把编码需用的所谓字根,分组排布在键盘上,是因为那些字根是随意拆出的,没有共识性。不得不把所有字根排布上键盘上,供操作者拆字参照。不言而喻,难学易忘的形码即将退出市场(它们做出过贡献,功不可没)。随意拆字,悖逆字形规范的闹剧就该收场了。音形码如能取音码和形码之长,避形码和音码之短,可望独领风骚。 |