湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

 

《谈从理与从形拆分原则
——兼论“相离可拆”与“交重不拆”
评注

 

评:标题“从理”为现代汉字设定拆分原则,就令人觉得迷糊。也许作者认为汉字拆分确实太困难,就想到以字理来寻出路。当然,有困难,就应该有新的设想,设定多渠道的寻找方法。不过,这只是学术上的设想和探索,不是规律的发现。一种文字应用研究的学术设想,被当做学术成果,以行政手段推广应用,是反科学的行为。文字研究的成果交付社会应用,有很强的“约定性”,错误的东西一经约定,就很难改正。

王宁先生既然已经提出了按“理据”将汉字拆分为部件的设想后,照理,他自己首先要把汉字集中的部件拆出来,至少应该把一级字库的3755个汉字全部拆光,从中就可以得到许多有用的数据,例如:一、其中有多少是有理据的,有多少是没有理据的;二、全部拆光可以得到多少部件,这些汉字在拆分的过程中有些什么规律。三、在这个拆分的过程中,碰到了那些困难,出现了那些问题,取得什么经验。然后,就可以写出一个拆分的报告来。这不是我给王先生出难题。题目是他们自己出的,他们自己当然应该“心中有数”。

把汉字拆分为部件,本来是很容易的。根本不需要像先生写的那么复杂。首先给部件下定义,按定义拆分汉字集中的汉字,就得到了一张这个字符集的部件清单。然而,王、陈两位教授不愿意使用定义,提出“从理”的拆分方法,这是违反常规的。字理与部件,一点都不搭界。字理是讲汉字形成的道理。从古至今,没有一个文字学家讲字理时,曾说到部件这个概念的。这说明在古文字学的字理中,不存在部件。在没有部件的系统里找部件,岂不是缘木求鱼,知其不可为而为之?

副题“相离可拆”,却又规定“’、‘’均不再三分”(见《关于制订〈汉字部件规范〉的若干问题》的第“五、4.(5)”)。自己打自己的嘴巴?五笔字型将“氵”拆为“丶、冫”,遭到许多教育界学者的口诛笔伐。也许作者不是这个意思。但“不再三分”,却含有“可以二分”之意,加上“可拆”两字,“五笔”作此理解也不会错。“交重不拆”也有二义。即不重可拆。那么“东”拆为“七、小”也不错了?这样的原则叫人如何遵循?不如提“相交不拆”,那就明确多了。

 

部件拆分是汉字信息处理中不可缺少的工作。因此,在相当长的一个时期内,不同地区、不同系统自发地进行部件拆分,其结果是纷纭交错、五花八门。例如,一个简单的“羊”字,竟有5种拆分方法,而5种拆分法贯穿到由“羊”组合的字里,要影响到将近70个字。而且,有些系统在处理一些由于笔画变异而形成的变体时,又出现了与“羊”不一样的拆分。例如,把“羊”整体保留下来不拆的,却把“羞”、“翔”、“羚”中的变体“羊”拆开;把“羊”拆成3个部件的,却把“美”、“善”、“羔”上部拆成2个部件。一个仅有6笔画的常用独体字尚且如此,可见笔画更多、构形更复杂的字,就不用说了。

 

  评:开篇第一句话“部件拆分是汉字信息处理中不可缺少的工作”,应改为“汉字拆分为部件是汉字信息处理中不可缺少的工作”。如果认为“汉字拆分为部件”这样的提法太麻烦,起码也应该说“汉字拆分”,不应该说“部件拆分”。不过,我相信严谨的语言学家也不愿意说“汉字拆分”的。因为,“汉字拆分”包含“把汉字拆分为部件”和“把汉字拆分为笔画”两重含义。而“部件拆分”只能使人理解为将部件拆分为笔画。迄今为止,笔者确实很少看到有这样开篇就错的文章,尤其是作为语言文字类学术性的文章。

开篇第一段就举出了“羊”的乱拆分为例。还把“”也当作“羊”。尽管古代的“羔”含有以火烤羊的意思,却没有说“羊”就是部件,因为古文字学从来没有“部件”这个概念。“羊”是一个现代汉字。“”则是现代汉字“羔”的一部分。它们可不可拆分,要看它们现在的结构是不是能够拆分,而不应根据它在古代是不是独体。我们现在的目标是要把现代汉字拆分为部件,不是把古代的甲骨文拆分为独体。

 

部件拆分出现如此混乱的局面,给汉字信息处理带来了严重的不便。而哪种拆分是合理的,衡量起来无据可依。这使大家认识到,在信息时代,部件的规范是汉字规范的一个有机的组成部分。如果不进行部件的规范,语言文字的规范必然要因此受到冲击。计算机编码中部件使用的混乱状况必将使信息传播的速度和准确度受到影响,进而干扰基础教学,妨碍国际交流。可以说,现代汉字部件规范化已经刻不容缓。

 

评:“哪种拆分是最合理的,衡量起来无据可依。”此话也不应该是写“拆分原则”者说的话。因为你们已经提出了拆分原则:“相离可拆”和“交重不拆”,应该按照构字的“理据”,从古汉字中寻出“理”来进行拆分,怎么可以说“无据可依”呢?所以,这句话也应改为“哪种拆分是最合理的,我们认为是有据可依的。这个‘据’就是古汉字构字的理据。” 作者既然认为“无据可依”,正说明他们对自己所提出的“理据”缺乏信心,这东西好用不好用自己心中无数。你们要为国家语委搞“部件规范”,可是自己却对汉字拆分心中无数(无据可依)“,岂不是拿国家的规范当儿戏?

 

要想使现代汉字的部件规范化,必须树立汉字构形规律性和系统性的思想。古汉字是表意文字系统,每个汉字的构形都以来自词义的字意为依据,是可以解释的。这种可解释性,称作理据或字理。现代汉字虽经过隶变、楷化的阶段,但并没有改变它的基本性质,大多数字形仍具有理据,少部分字形构字理据虽不太明显,但形与理没有矛盾,完全可以参考历史分析出来。其中极少部分汉字字形与意、源发生矛盾的,又可以放到构形系统中进行优化处理。共时平面上的汉字具有内部的系统性,汉字与汉字之间存在着相互的联系,每个汉字在系统中具有自己的位置,并受到相邻汉字的制约。所以,对于汉字构形的分析,从个体看,有字理作为依据;从总体看,有系统中的前后关系加以制约,是有客观规律的。部件规范应当是这种客观规律的忠实体现,而不是将一些人的主观意志强加给一另些人的随意行为。因此,在对现代汉字的部件进行规范时,必须定出符合规律、符合实际、符合优化的操作性条例。

 

  评:现代汉字构形的规律性和系统性不存于古代汉字系统,而存于现代汉字系统本身。因为在古代汉字系统没有笔画,也没有部件。任何研究,第一个问题就是立足点的问题。古代人用独体拼成古代汉字。现代人用笔画构成部件,用部件拼成汉字。独体是古代汉字的基本单元;部件是现代汉字的中间层次。古代汉字构形的规律性和系统性,适用于把古代汉字拆分为独体;现代汉字构形系统的规律性和系统性适用于把现代汉字拆分为部件。这是两个完全不同的系统。一点也不沾边的东西,怎么被划上了等号?

 

现代汉字是指书写现代汉语的楷书字,它是由历史上的隶书、楷书直接演变而来的,从个体字形看,它又是自甲骨文以来各代字形直接或间接积淀的结果。从科学测查和量化的情况看,这种汉字保留理据的比例仍然很高,而且,这种理据可以分析或追寻。

例如:小篆中的“勹”(bao)像人的两手曲形有所包裹的样子,凡从“勹”字的字,多有圆曲、周遍、包裹、内聚等意思。而在现代汉字里,这一形体演变后,不像曲形包裹状了。但是,依靠组合和聚合,以群体作背景,仍能显示其构意。如包(婴儿在襁褓中,义为包裹)、匊(两手捧着细碎的米,义为掬起)、旬(日子经十而一度循环,义为十日)等。在组合的另一部件配合下,理据能够显现,甚至表现得更为明显。

又如,楷书的“四”在构字时是“网”的变形,它虽已失去网形,但却具有网意,为罟、罹、詈、置等提供理据;“矢”已不像一支箭,但却具有箭的意义,因而可以给矩、短、矮、矫等提供理据;“隹”已失去短尾鸟的形状,但却从语言中承袭了zhui音,因而可以给谁、椎、碓等字提供声音信息。

经过隶变时部件的粘合,加上受行书连笔的影响,原来的古文字基础构形元素产生了形体的粘连,有合二而一甚至合更多部件为一的现象。例如“辶”、“共”、“西”、“更”、“退”等字即如此。因此,在古文字的多部件合体字里,理据可以一直贯穿到最后一个层次。而在现代汉字里理据大多保留在一级部件的组合中,越到后面的层次,保留理据的数量越少。后来的偏旁、部首分析法就是适应现代汉字这一特点而产生的。当然,这对分析和讲解现代汉字提供了部分依据。

由于书写的缘故,笔画趋于平直后,一些原来形体与意义完全不同的独体字,一旦进入构字,便发生了形体异化,变为同形。例如:青,小篆原从“丹”,楷书从“月”;朔、期,小篆原从“月”,楷书仍从“月”;服、俞,小篆原从“舟”,楷书从“月”。在分析理据时,必须承认“月”这一部件分别来源于“月”、“肉”、“丹”、“舟”等不同的独体字。

反之,原来形体与意义都相同的独体字,一旦进入构字,由于部位的不同和受相邻部件的牵连,又可能异化为不同形体例如:在“尉”中,“火”异化为“小”;在“光”中,“火”异化为“”;在“然”中,“火”异化为“”;在“赤”中,“火”异化为“”;在“黑”中,“炎”上部的“火”异化为“土”。但是,只要在分析理据时,承认“小”、“”、“灬”、“”、“土”在“尉”、“光”、“然”、“赤”、“黑”中都同源,都是“火”的变体,字理便仍在分析中起作用。

 

  评:已经发掘的甲骨文有四千多字,我们能解释的还只有一千多字。连古文字学专家还解释不了三分之二的古汉字的理据,作者竟然要求一些普通的编码设计者运用理据拆分汉字,想得实在太巧妙了。甲骨文是已经形成了系统的文字。而在甲骨文字形成之前,又有什么样的“理据”来产生甲骨文呢?这一点恐怕作者是还没有想到的。既然“理据”之前还有理据,那么汉字的拆分要按哪一个理据作准?分析理据是讲古代汉字形成的道理和依据,与将现代汉字拆分为部件是完全不相关的两件事,根本不能混为一谈。

  作者说“在古文字的多部件合体字里,理据可以一直贯穿到最后一个层次。”由此,我们完全可以理解,作者把部件与独体完全等同了。正因为这样,他们才”创造“了一个”多部件合体字“的新概念。古人用独体拼成合体,有许多合体字都有三个以上独体拼起来的。这样的字,只能叫做多独体的合体字,怎么可以称为“多部件合体字”呢?

与学生讲解“小”、“”、“灬”、“”、“土”在“尉”、“光”、“然”、“赤”、“黑”中都同源,对学生识别汉字字形,究竟起了什么作用?答案是:唯一的作用是打乱学生认字的识别能力!字理,只是作为现代古文字学家研究古文字的参照,不是把现代汉字拆分为部件的准则。

 

汉字构形理据的客观性及其可追溯性,免除了部件拆分的主观随意性,决定了拆分正误的可辨性,也保存了它历史文化的未来面貌,所以,部件规范必须使依理拆分充分体现。

例如,两部件的“们”、“引”,三部件的“鸿”、“靴”(其中“江”、“化”为二次拆分),四部件的“啊”、“姿”(其中“阿”、“次”为二次拆分,“可”、“欠”为三次拆分),五部件的“器”(为一次拆分),六部件的“僵”(“”二次拆分)。这些拆分都是按理据、依组合层次的反向进行的。

评:作者在这一段中给汉字编码设计者作出了拆分方法的规定:“一次拆分”、“二次拆分”、“三次拆分”等等。编码设计者对汉字的拆分,只是一个设计的过程,在编制好部件清单后,拆分方法是没有任何痕迹留下来的。规定“鸿”、“靴”要先拆为“江、鸟”,“靴”要先拆为“革、化”;“啊、姿”要分三次拆干净。这样的规定正说明作者是个完全不理解汉字编码方法及其过程的外行。编码设计者要取得的是部件,不是拆分过程。他们把”啊”拆为“口、阝、丁、口”,并不需要先拆为“口、阿”,再到“阝、可”,再到“丁、口”,他们需要的是“口、阝、丁”这样的部件。至于“啊”字该如何拆分?我想,任何一个人都会把它一次性地拆为“口、阝、丁、口”,而根本不需要和使用那样麻烦的“手续”。

 

又如,“赤”的字形原从“大”从“火”,“大”异化为“土”,“火”异化为“”,但“土”与“”仍明显区别为相接的两个部件,因此,参考字源将其拆分为“土”、“”,既合字形,又合字理。

但是,在下面两种情况下,依理拆分是无法贯彻的:

1)由于现代汉字的简化与笔画的形成确实有一部分形体既不保留理据,又由于字形与意发生矛盾,而难以重现理据。

例如“甫”,原从“用”,“父”声,“父”即“斧”的古字,斧标志权力,所以,“甫”是男子的美称。在小篆中“父”与“用”已交合为一形,无法分析。

又如“至”,甲骨文以一支箭(矢)射中目标会“到达”之意,《说文》小篆把箭头变成较大的弧形而失去“矢”形,解作“鸟从高下至地也”,对理据的讲解已很勉强。楷书将箭尾的上端拉平成横,曲处写作“厶”,下变“土”,外形成为三个相接部分(一、厶、土),使原来的理据毫无对应,难以重现理据。

再如,“舂”原像两手(収)捧杵(午)在臼中舂米,是一次性合成的四部件字。隶变、楷化后,“ 午”与“収”粘合成“”,本身是非字部件,不具音义,又不能再行拆分,无法分析理据。再加上“”与“春”、“泰”的上部同形而不同源,归纳字意也不可能,成为一些文字学家所称的“记号”,使它们所构的字不再能重现理据。

 

评:以上这些话,是作者在显示“理据”的“学问”,不是在讲解汉字的拆分。

现代汉字的“舂”,是因为它来自“原像两手()捧杵(午)在臼中舂米”的甲骨文,对此,作者说这是“一次性合成的四部件字”。这里作者明显认为部件就是独体。作者又说“舂”是个四部件字,又不能把它拆为四部件,只能按现在的字形把它上下两分。可见所谓的四部件字,纯系牵强附会。古汉字中只有独体,没有部件。以古汉字独体的多寡,来确定现代汉字的部件数,是错误的。按现代汉字的字形来拆分,“舂”只能拆为两个部件,应称之为二部件字,上面的“”算一个部件,下面的“臼”算一个部件。“”没有字义,称为非字部件;“臼”有字义,称为成字部件。“”与“臼”相对独立,可以分离开来。这就告诉我们,部件具有相对独立和可分离的两种属性。凡是在汉字中具有相对独立和可分离的两种属性的笔画结构块,都可称之为部件。而不管古代它是由几个独体演变而成的。所以,对“春”、“泰”上面的“”,就不需要分析“形、源”,更不需要什么“重现理据”了。讲明白点,我们的目的是把现代汉字拆分为能拼现代汉字的部件,而不是把现代汉字拆分为古代的“部件”(独体)。

 

2)前面说过,一部分汉字到楷书阶段时,理据仅仅保留在第一构形层次里,以后的层次理据有丧失现象。但是,拆分下来的部件,其信息量和区别度都要符合信息处理的需要,部件的总体数量也要尽量控制,因此,部件在一次拆分后,还需再度拆分。

因为有这两种情况的存在,在有理据拆分之外,还必须补充以无理据拆分。无理据拆分仍然不能随意的,必须依照汉字形体的特点和部件的系统性来进行。具体做法是:

 

评:作者提出的“有理据拆分”、“无理据拆分”、“依照汉字形体的特点和部件的系统性”拆分等三种方法,背离汉字拆分必须实现唯一性的原则。汉字的拆分,应该只有一种方法、一重标准,而作者竟然提出了多种方法、多重标准,这与“规范”本身就是有矛盾的。因为,所谓“规范”,就是要求一种标准,尤其是对文字的要求,更且如此。

 

理据应合而楷书分离的,如“”,原像交构连接之形,上下本不可分,楷书将上部与下部分别楷定,成为两个相接的部分;又如“朋”,甲文像两串相连的贝串,小篆像鹏鸟的羽翅,都相连不能分,楷书以两个相离的“月”字构形。在这种情况下,字形有拆分的可能性,这就是拆分规则所说的“相离可拆”。但“可拆”不等于“必拆”,是否拆分,要看拆分后的部件有没有归纳的可能性,是否有利于部件系统的优化。

 

评:两个部件在汉字中相对独立,有的处于一种“相离”状态,有时处于相接状态。说“相离可拆”,而相接呢?可拆不可拆?没有交代了。作者认为根据理据,本不可分,因为“楷书将上部与下部分别楷定,成为两个相接部分”:“”与“冉”,其意思是“可拆”了。但这不是“相离”,拿它做例子说明不了问题。

部件是汉字的中间层次,下面还有笔画。笔画与笔画也会因“相离”而构成部件,例如“二、三、灬、巛、彡、氵……”等等,是不是也可以拆呢?当然不能拆。那么,“相离可拆”是专门指部件与部件之间的“相离”,不是指笔画与笔画的相离,可见这个原则有很明显的含糊性。原则必须清晰,不能含糊,含糊是不能成立的。

 

理据应分而楷书交织、粘合的,这里又分两种情况:

1)原有部件完全交融,形体完全成为笔画的直接组合。如“甫”、“史”、“吏”等,既看不出拆分的可能性,又没有拆分的客观依据,应视为新的独体字。

 

评:这里又出现一个“新独体字”的新概念。它的意思是“看不出拆分的可能性”。反过来说,原来是独体字的,例如“虎、象、鱼……”等等,它们都具有拆分的可能性,是否应称之为“新合体字”呢?

 

2)少部分现代汉字,本为古文字描写性的隶定字楷化而成。它们的构形与意、源本是一致的。例如:“秉”,原取“手握禾苗”之意,“禾”与“”(“又”的变体)是相交组合;又如“東”,小篆取“日出东方”之意,“日”插在“木”中组合,“束”、“口”像捆绑状,与“木”相交等。这种穿插结构原是多体象形的遗存,楷书象物性消失后,部件交合的原因已无法解释,其实与第一种情况已没有什么两样。这时也应尊重字形,不再拆分。

以上两点就是拆分规则所说的“交重不拆”。制订这条规则,还为了在统一的原则下控制拆分的下限。一旦允许交重可拆,无论什么地方拆、拆成几部分,都无法避免如本文开头所举之例那样的随意性。另外,“交重可拆”还会破坏基础部件集的系统性。

在有理据拆分中,字形与字理是一致的,因此属于依形拆分。在无理据拆分中,字形与字理发生矛盾而采取尊重字形的原则,因此也属依形拆分。尽量尊重理据而不违背字形,其目的是尊重历史而不复古,立足现代而合乎规律,这样做,既维护了汉字的历史传承性,又维护了汉字共时的系统性,使汉字信息处理用的部件在符合规律的基础上取得一致。

形与理的一致性,反映了汉字历史与现状的契合,而形与理的矛盾则反映历史与现状在发展中的变革。把形与理放到两个层次中去处理,目的是为了从现代的实际出发,同时又尊重历史与传统。只有这样做,诸多矛盾在不同层次、不同维度之中才能化解,使部件系统达到优化。

 

评:写学术文章,提出一个概念,首先自己对这个概念必须认真思考:有没有二义性?像“交重”两字,就是有二义的,“交不重”,咋办?

 

自觉遵循汉字自身的构形规律性,同时因势利导地调整汉字的社会约定性,立足现代,尊重历史,许多问题才能得到合理的解决。这是汉字部件规范所显示出的更为深刻的意义。

近些年来,我国出现的形码、音形码数以百计。全国信息技术标准化委员会或全国中小学计算机教学研究中心向全国推荐使用的表形码、郑码、自然码、认知码以及表音码等因原部件拆分的规范性较好,在《汉字部件规范》公布后,它们的设计者很快将编码修改为与规范一致,而且保持了各编码原有的特征与风格。这充分说明该规范完全是可操作的,今后它将成为一切形码部件拆分规范性的检验标准。

 

评:为什么要制订《汉字部件规范》,理由是各种字形编码把汉字拆分得乱七八糟,制订“规范”,让他们有据可依。《汉字部件规范》就是拿出一张部件清单,给各种字形编码设计者参照,要求各设计者:拆分汉字为部件,必须是清单里的东西,不要拆出清单之外的东西来。这才叫“规范”。其实,这种想法本身就是错误的。

根据笔者研究,一个编码方案,无非是一张清单,分成几十个类,每个类给一个代码,然后,用这个规定给汉字集中的每个汉字编上代码,这个方案就完成了。现在《规范》研制组已经拿出了清单,只要给它们分分类,再加上一个代码,就成了一个“规范”方案了,又何苦给别人“规范“呢!

《汉字部件规范》有了部件清单,它当然包含所有汉字的部件。每个汉字中既然已经含有清单中的部件,只要对照着分解,就是非常“规范”的。每个编码方案的设计者,都按“规范”的清单来分解,“拆分”就完全统一。如果再加上一个“规范”的分类,“规范”的映射,全国的编码也就统一了。所以,“规范”拆分也就纯属多余!

上述这些方法(分类、编代码等),要到编码的实践中去总结、去研究,而不是主观地规定一种方法。我们奇怪的是,王宁先生从来没有研究过编码,怎么担起《汉字部件规范》研制任务的?也许有人会问我是怎么知道王教授没有研究过编码。很简单,从他文章里对概念解释的错误,就可以判断出来。例如他说:“将汉字拆分为部件,称为部件拆分。”这种说法,大错特错:将汉字拆分为部件,只能叫汉字拆分,不能叫部件拆分。这样的错误不该出在大学的语言学教授身上。他在1997年,发表了一篇《汉字的构字理据和汉字部件拆分》,连个题目都不通!人当然不能不犯错误。但有许多错误本来是可以避免的,而为什么避免不了呢?因为有的人有了地位,就不注意知识更新。许多新概念出现了,注意更新的人会知道面对新东西必须认真学习和思考,不带老眼光去看新问题,不用老思想对待新事物,这样才能避免在一些最简单的问题上出笑话。

语言学界的学者,众口一词地认为拆分汉字为部件是最困难的事。其实,汉字拆分并不困难。许多学术中的困难,是因为人们没有想到它一个系统,而是单打一地看一个方面,不去想它们的系统关系——这些关系,相互制约,相互依靠,才构成它们的存在。对待这样的问题,只有全面兼顾,一起解决,方能成功。要知就里,请阅下面《汉字拆分的系统性》。此文已发表于2002年第4期《汉字文化》。

 

文载《计算机世界》1998年4月27日D4版,作者:王宁 陈一凡

 

 

下册

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有