湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

 

§5.3  部件的定义

 

举例说,你要叫人代买缝纫机,不告诉他是做衣服用的,而只告诉他机器的大小、高度,或零件的多少等,那人买回来的东西,一定会令你失望。这不是买的人不理解,而是交代得不清楚。要想拆出汉字集中的全部部件,首先要知道部件的本质属性。就是说,部件的定义,要交代的是部件的本质属性。

一、部件的本质属性

我们认为,部件的本质属性有二,即可分离性和相对独立性。可分离性使汉字拆分为部件;相对独立性维护了部件的存在,制约它被拆为单个笔画。拼构汉字中的单个笔画,只要有可分离性和相对独立性,也应该承认它是部件。

“口、人”是汉字,但在“吕、品、从、众”等汉字中,它们是部件。“丨、乚”等是笔画,但在“引、旧、扎、孔”等字中,它们是部件。象“司、词、同、今、买、断、乏、孔、扎、玉、犬、亿、乞……等”,这些汉字中都带有相对独立的笔画,我们统计它们参与组成的汉字有八百多个(指国标两级字库,附表于后),不是一个小数目。如果不把它们算作部件,任何人拿不出道理。

“一”是成字。但它在汉字中是一个笔画:横笔。“旦”是“日”和“一(横笔)”拼成的。“日”和“一”单独存在都是成字,而现在组成“旦”之后,如果只承认“日”是部件,不承认“一”也是部件似乎有点说不过。如果“旦”再加一横成为“亘”字该作如何解释?这两个笔画,到底算一个部件,或是算两个笔画?

两个“口”拼成一个“吕”字。“口”只是“吕”的一个部分,不再有“口”自己的字义了,即不再行使自己的功能了,“口”成了“吕”的部件。如果“口”独自在汉字的队伍中,“口”就是成字。“吕”可以分为两个“口”,这两个“口”的关系,就是一种相对独立的关系;由于两个“口”之间存在着“相对独立”的关系,因而它们就产生了可分离性。但是,这个“吕”中的“口”,就不能再分了。因为再分的话,“口”就变成笔画,部件就变成零件了。陈代于先生说这是部件的“不可再分”的属性。不可再分的属性,是部件中自身笔画与笔画之间的基本结构关系构成的。(例如“口”,三个笔画顶端相接,形成一个封闭包围结构。这种结构,是汉字部件的基本结构,是不能拆分的。)由此可知,汉字中部件与部件的关系,是以具有可分离性和相对独立性为依据的。如果某些笔画具有可分离的和相对独立的两种属性,都应该算作部件;两个以上笔画构成的部件,还要增加一种叫做“基本笔画结构”来制约“可分离性”和“相对独立性”。用大小和多少作为部件的标准,是非本质的;用部件属性作为部件的标准,才是本质的。

不具备以上属性的笔画,如  ”,它永远与其他笔画交在一起出现,没有以上所述的属性,就不能划作部件。“”也无法得到证明它有以上的属性。它在“丐”以及其他字中都是如此。因此,“”算不算部件就应该讨论。如果不算的话,“丐”字就应该划为部件。这么做,要权衡利弊。

如何权衡拆与不拆的利弊呢?再以“丐”为例:将“丐”拆为“”,多了一个难能证明的部件“”,对“丐”的拆分就需要讲解,这是弊的一面,但它能使“丐”有两个部件了,可以排列了,符合编码的目的:使汉字成为线性文字,这是利的一面。不拆,“丐”作为一个部件,可以得到“相对独立”的证明:在二级汉字库中,“丐”拼出了“钙”字,它与“、”两个部件中间有明显的间隙。在部件总数上,无增无减(也就是对部件定量没有产生影响)。拆开需要对丐的拆分加以讲解;不拆,不利于实现将汉字排成线性的目的。假设这两者也是利弊各半,还有一个相关联问题是分类。“丐”作为部件,我们很难把它归入某一个类别,即使能够归入,也是很勉强的,就会增加记忆。而“”都已经有了现成的类别。按照上面的比较,拆比不拆有利。也许我们这样讲,有不对的地方,这就需要大家一起讨论了。总之,部件是汉字的“元素”,确定一个部件,或决定一个汉字的拆分,都是很严肃的事,不能掉以轻心。

文改会有一张648个部件的清单,并且使用频度统计。这张清单为后来的字形编码设计,作出不少的贡献。五笔字型也照样搞了一个字根频度统计,选用了99个字根。不入选的字根,则规定用已入选的字根进行套拆。有的还是套拆不了,就规定用某个相似的字根代理。逐个规定使得五笔字型有很多的记忆量。

部件和字根都是作为汉字的中间层次,提供给字形编码设计用的。可惜五笔字型的字根作为汉字形码的基本材料并不好用。依据统计频度挑选出来的字根表,无法形成一个系统,太杂乱,记忆量太多,学习下困难:一是选用数量没有标准,纯属主观随意。(不同的选用数量就可以出不同的方案。)二是组字频度并不一致。有的部件组成常用字,使用频度很高,但组字频度很低,选不选都有问题。三是选用高频部件不能套拆在于他们的部件或字根都不是根据部件的本质属性得到的。

根据部件自身属性得到的部件,在汉字中能使我们一目了然,因为它符合汉字结构规律,也符合认知心理;否则,主观选出来的部件,分解时就得逐个规定,不容易记住。

二、部件定义的设计

给部件下定义必须有个准则,不可随意乱下。现在有那么几十个定义,说明文字学界和编码界,存在着为定义而定义,为拆分而拆分的错误倾向。产生这种错误倾向的根本原因,是不理解部件定义的系统性。

给部件下定义,首先要知道这是为也什么。我们认为给部件下定义的目的是为了拿到部件清单;部件清单就是部件的定量;根据清单就可以归纳出汉字的拆分规则;也可以给部件分类。因此,定量、拆分、分类都制约部件定义的产生。这个定义,不是文字学的,而是汉字字形编码设计学的。图9是设计示意图。

部件定义设计图

9表明给部件定义的的要求:要导引出拆分的原则,定位(定量的依据)的界限和分类的方法;三者制约部件定义的制订;该图还表明:拆分、定量、分类,三者构成了一个以拆分决定定量,以定量完善分类,以分类制约拆分的系统结构。

说明白一点:没有拆分,有多少部件就不能确定(即定量);没有定量,就不能进行分类;没有分类,就不能制约拆分。这是一个相互资生,相互制约的循环圈。拆分、定量、分类,这三者既生于定义,又制约定义的产生。

通过这个设计图,我们就可以“按图索骥”,根据上图给部件下定义。

三、部件定义

根据以上分析,我们认为部件的定义应该是:拼构汉字的具有可分离性和相对独立的基本单元——笔画结构块或基本笔画。上述定义可见部件的本质属性有二:一是可分离性;二是相对独立性;相对独立又受制于笔画结构。现在我们可以对以上的定义设计进行验收,看它是不是符合要求。如图10所示。

10  部件定义验收图

现作简释如下:

(一)可分离性。可分离性是部件的动态属性:部件与部件之间因拼合汉字而产生间隙,这种间隙就是拆分的依据。

间隙可以分为显性间隙和隐性间隙。

显性间隙是指:部件与部件之间,有明显的可以一目了然地看出来的间隔。

隐性间隙所指有七:

1、两个不同的成字部件之间,如“古”的“十”、“口”之间;

2、两个笔画走向不同的笔画结构块之间,如“示”的“二”、“小”之间;

3、两个不同的笔画结构块之间,如“早”的“曰(包围)”、“十(交叉)”之间;

4、一个成字部件与另一个笔画结构块之间,如“占”的“”、“口”之间;

5、一个撇笔与一个笔画结构块之间,如“自、千”的“丿(撇笔)”与“目”、“十”之间。

6、与“戈”字类的横笔相接或相交,如“戢、我”。这里事实是分开的两个部件,但它们的笔画走势和位置在同一条线上,为了书写(或刻字)方便,连在一起了,现在我们需要拆分它们,必须恢复它们原来的面貌。

7、相离型部件类中的部件,笔画与笔画,或笔块(笔画)与笔块之间也有相似显性的间隙,但它们之间,或相互平行,或相互向中心聚合,或相互依存,形状相似、方向相反,存在着一种内聚性,构成自身的存在形式,是不能拆分的。

这里成字部件是指含有字义的部件,如“大、木、口、日”等。笔画走向是指笔画书写的方向,就是自上向下、自左向右。

(二)相对独立性。相对独立性是部件的静态属性:它既维护了基本笔画结构块不再被继续拆分为单个笔画,又保证了合条件的单个笔画作为部件的“合法地位”。

笔画结构块是指笔画与笔画之间构成最基本的结构关系,它可以分为五种类型(三种基本类型和两种特殊类型):

1、  笔画与笔画相离,称相离型;

2、  笔画与笔画相交,称相交型;

3、  笔画与笔画相接,称相接型;

4、  笔画与笔画相接后形成包围,称包围型;

5、  两种基本笔画结构混合构成的,以某种基本特征为架子的结构关系,称字架型。

字架的条件是每一个小类都以一个共同的特征为架子,然后增加笔画或改变笔形,形成一个个的类别。

“块”是指由两个或两个以上笔画为基本结构构成的部件。在汉字中,它是可分离的;对汉字中的其他部件来说,它是相对独立的;它又是两个以上笔画构成的基本结构。

四、部件定义的运用

如果部件只有可分离性,拆分必定要拆到笔画,正因为如此,有的人才会认为汉字的基本单元是笔画,只有笔画,才不能再拆下去了。这是它的动态属性所决定的。可是,汉字检索和计算机的应用的实践告诉我们,在汉字与笔画之间,还应该有一个中间层次——部件。缺了这个层次,不宜应用。这个中间层次,必须是相对独立的。只有相对独立,才能制约它的可分离性。因此,相对独立是它的静态属性。

然而,相对独立的概念,还是模糊的。这是指它的笔画结构块和基本笔画。陈爱文先生说:“部件是一个‘笔画结构块’,那么它应该有两个以上笔画,而且应该形成‘块状’。”“一、相交叉的笔画是一个结构块。二、相粘连的笔画,一般属于一个结构块。三、布局匀称的相分离的笔画是一个结构块。四、封闭框内部的笔画如果跟外框是粘连的,则合起来算一个结构块。框内的点笔一般附属于外框。五、单独的点笔一般附属于它附近的结构块。”(8)这里的解释已经基本清楚。

例如“艾”,这是两个相交叉的笔画结构块;“从”,这是两个相粘连的笔画结构块;“泣”,这是两个相分离的笔画结构块;“昌”,这是两个包围状的笔画结构块。两个块既可很方便地分离开来,又是相对独立的。所谓相对独立,有一个意思就是它保持自己的完整,让我们一眼看出来。例如“泣”,左边是“氵”,右边是“立”,两边都可以独立组字。又如“旦”,“曰”和一个横笔。“曰”是独立的“块”,“一”这个横笔怎么办?明明一眼看出是相对独立的,不称它为部件,就无法解决。

有明显间隙的部件,可以一目了然地看出来。对那些没有明显间隙的、连在一起构字的部件,我们提出隐性间隙的概念。隐性间隙也符合认知心理规律。我们在认字的过程中,先都是接触一些笔画结构简单的字。这些字,有的自己就是一个“结构块”,例如“十”(交叉结构)、“口”(包围结构)。它们拼起来是个“古”字,虽然粘在一起,把它拆开来作为部件也是符合认知心理的。又如“示”,“二”和“小”粘在一起,这是两种不同的笔画走势,拆分开来,也可以接受。如果拆为“一、丁、”,心理上反而是不容易接受的。正因为这样,张普先生才认为“相离应该优于相接”。

“相离优于相接”的拆分原则,用于“辛”,很容易接受,而用于“亍、亏、产”,却有困难,不直观,人们在识记时,心理上有障碍。这是什么道理?北京计算机学院的徐劳立副教授有一个很好的量化计算方法,根据认知心理上的可接受程度,用数字表示:成字部件=3;笔块部件=2;单笔部件=1。例如“辛”,拆为“立、十”,两个都是成字部件,合起来计数为6;拆为“、干”,只能是5;“亍、亏、产”可拆为“一、丁”,“一、”,“、厂”,比拆为“二、亅”、“二、”、“立、丿”,计数大。因为,在我们的识记过程中,对汉字拆分为部件的接受,必然是:成字部件>笔块部件>单笔部件。在汉字中,“一”是特殊的。它身兼“三职”,既是汉字,又是部件,又是笔画。如运用以上计数方法,“一”必须在单独处于分离的状态时,才能作为成字部件。

运用定义拆分汉字,不要受字义的束缚,即不要受构字理据的束缚。如今有几人知道构字理据?例如有的人认为“  ”应该算一个“块”,因为,这是从“止”演变过来的,它代表人的脚。如果这么讲,“ 虎”变成了“、七、几”也不能拆分为三个“块”了。“邑”只能作为“阝”,也不能拆开来了。因此,我们从汉字中分解出部件,必须排除字义对分解的干扰,把它们看成为在目前情况下,都是一些笔画结构符号。把汉字分解为部件,要符合学习者的认知心理规律,要符合直观原则,这是最重要的。例如“足”,上面的“口”和下面的“(人的变体)”都应算成字部件,那么,把当中的“”拆出来,也就容易接受。

运用定义分解汉字,个别地方会有一些困难,例如“习”还可以再拆为“、冫”,“”还可以拆为“”,“酉”,也可以拆为“西、一”。对这些是拆,还是不拆,可以认真讨论,分析利弊。例如“”,只在“鼠”字里用到,不拆,多了一个部件,但没有实用意义;拆,减少一个部件,等于减少一个记忆单元,利大于弊。有的人借此强调汉字的拆分没有规律,就可以任意,这没有道理。因为,这些例子是汉字中极个别的。如果,一张部件清单的95%以上可以通过,余下的根据利弊关系进行评估,再逐个通过讨论确定,拆还是不拆。确立部件不是一件小事,个别有争议的,必须撰写必要的论文,进行利弊论述。

附:有明显间隙的单笔部件拼字统计表(共856个):

彳、一、行、徉、衍、愆、徜、灭、亏、征、衙、惩、徂、衢、亘、死、得、徽、微、徵、律、徇、往、彷、彼、徨、徼、循、徙、彻、徕、鹂、丽、郦、逦、豆、豇、豉、豌、逗、融、翮、鬲、副、逼、很、徊、画、亍、徐、御、役、後、徘、德、待、街、径、亓、兴、举、誉、污、洹、沙、娑、挲、裟、渺、涔、滢、漭、少、省、泛、劣、汽、沭、渲、洞、洽、泠、汔、泼、澍、汛、灼、乳、与、马、珩、欤、骊、黔、巧、玛、珏、玉、驴、骟、琅、骗、驺、驹、驻、骧、骇、骢、骄、驰、骒、驼、骣、驷、骡、驶、驮、骑、骁、骠、骏、骀、骖、验、玲、骓、骅、驸、驳、球、骋、妙、妈、叉、妲、妒、妫、妁、鸡、妗、姒、对、怼、眇、眨、蝠、蜮、蚂、卵、匾、蝙、螂、蚁、虾、蛤、蛉、虼、蚓、鸥、旦、量、暄、户、戽、綮、肇、朗、郎、肩、房、扇、良、翩、扁、扃、遍、启、扈、戾、雇、扉、然、义、时、字、鸳、屿、蹁、踉、鹨、趵、蹴、咔、蹰、岑、帼、跗、屹、帆、跋、峙、寻、撙、抄、捋、书、甫、担、揭、护、捩、韧、搭、扑、抓、抵、扎、拟、揸、揎、挖、拾、捻、拎、拊、扰、拢、拔、拨、执、寿、挚、絷、鸷、蛰、贽、势、垫、挝、持、肟、胆、脯、膊、鹏、骶、胍、腑、腭、胯、肽、肘、胩、荇、匐、蓰、薇、蘅、玺、莎、蒗、薄、蒲、刃、勺、葛、莨、芦、蓦、忍、莳、芝、荨、莆、匍、靼、菝、芍、菟、苄、苎、芩、莜、茯、苻、兔、逸、药、茏、荮、芄、葑、艺、荬、菰、芤、鸾、卜、旧、褐、议、谝、亵、讣、诋、就、谔、瓤、孰、谂、讫、斌、讨、谳、诗、词、讯、痘、厨、咸、感、辱、应、痧、鸟、乌、鸵、瘙、射、臭、疸、的、庐、廊、乏、犏、鹅、搿、特、舣、瘩、爪、爬、底、麽、縻、乓、乒、厌、餍、靥、厣、魇、氐、鸱、邸、麝、么、府、疙、系、疣、胤、庞、魃、鸹、乱、压、鹄、痔、将、笊、状、答、筱、符、笼、等、气、氩、氘、笥、氛、氧、氚、氮、氡、氲、氙、氯、氖、氦、氕、氨、氤、氟、氪、氰、氢、恒、幅、鸫、怛、以、轫、忭、憾、恹、忾、轧、怵、乩、毙、恫、愕、鸬、辄、赴、输、愉、恰、怜、忧、忖、鸨、恃、忆、桁、桫、杪、耖、杩、杈、树、术、查、述、杓、朴、耨、榭、柢、札、楂、梵、楦、桐、橹、检、榆、耠、柃、栊、橙、村、闩、宣、同、富、窳、窆、窿、突、窬、冠、闯、写、阒、阆、冤、鹇、骞、鹤、宠、守、嗝、吵、吗、唳、啷、哺、鹃、噶、呓、卟、鸣、呜、嗅、呱、喳、喧、嗣、鹗、鄂、颚、骂、哭、器、呔、吠、吓、喻、哈、吟、呤、咐、吃、哟、吲、咙、噔、咔、叼、吼、屐、屦、陋、隔、履、屣、尉、慰、隆、鹛、暨、璧、险、附、陇、骘、犸、国、畴、豹、狱、狐、猹、狩、畎、猃、囹、犹、夸、刳、匏、瓠、鹩、赋、太、犬、态、赙、鸯、贬、鹌、贮、鹦、夺、赇、酾、瓢、酹、鹊、酿、酌、鸢、饩、馇、酮、酞、酎、饲、福、雩、零、衩、下、袒、褐、谝、忑、祷、补、鸭、鸦、诋、鸸、耐、礓、砂、码、碍、碥、礴、砥、砭、碴、碹、硐、硷、矾、裣、袷、衿、袱、祓、衬、褂、词、鱼、鲡、鲠、鳝、鳞、鳟、鲜、秒、鲻、鳐、鲛、鲤、鳋、鲦、鲰、鲁、鲳、鳎、鲲、鳊、稂、鳗、鲥、鲟、鳓、鲽、鲍、鲂、鲸、鲚、鳜、鳇、鳙、鲧、秫、鲇、鲈、鲢、鲩、鲷、鳄、鲫、鳏、鳃、鲴、鳢、鳔、鲆、鳕、鲕、稣、鳅、鲐、鲵、稔、鲶、鲋、莸、鲱、鲅、鲔、鲼、鲮、鲭、鳍、鲒、鲑、鲺、佥、剑、敛、俞、毹、愈、觎、逾、俪、合、鸽、龛、翕、拿、龠、命、盒、歙、颌、僵、但、偏、食、仪 、伪、今、令、瓴、翎、衾、含、邻、领、贪、颔、念、傅、俦、仞、个、鹪、攸、修、倏、悠、仆、僦、候、低、仫、俯、似、鸺、伫、侗、短、侉、伏、矧、丛、俭、偷、伶、仡、优、俅、付、佧、侍、乞、亿、伺、迄、绗、继、纱、尤、凡、编、缚、纫、约、尥、缄、缛、鸩、龙、龚、聋、袭、砻、垄、弧、飨、绔、给、纥、丝、鸶、丞、卺、绂、纣、纨、幻、韭、登、凳、寸、丸、乾、过、博、鸠、献、鹁、驾、鹕、鸪、求、救、裘、逑、圬、垣、域、塥、埒、坦、埘、骜、鳌、塔、堍、卡、盐、坞、坻、垌、壹、垮、埝、封、刁、司、镉、钞、锊、钰、钗、钽、锒、铺、铸、钓、钋、钨、虱、孤、孔、钆、导、铜、锷、钛、骛、鹜、鹬、矜、镎、铪、铃、钤、钒、镫、钹、迅、钇。

 

上面所列出的这些字中,有的单个分离的笔画可组成一些常用部首,如“彳、马”,有人认为应该合并,以照顾使用习惯。但这部分只是少数,绝大多数仍然无法解决。而且,这里还有两个也要连带想到的问题:一是“彳、马”如果作为常用部首不予拆分,那么就必须在拆分规则下加附注,即要注明有几个常用部首作特例处理;二是作为一个笔画较多的字取码,最好左右各取两码,有利于分散重码。汉字集的处理和编码方案一样是系统性的,使用了一个解决的办法之后,跟着而来的又是一个新问题,该怎么办事先都要有所筹划,不能随便增减。把某些相对独立的单个笔画并为一个部首,对汉字的拆分、部件的分类,以及它的定义,都会带来新的问题。部件处理是一个系统性的问题,相互的联系和影响都要心中先有个数,既要照顾以往识字习惯,又不应被它们所束缚。殷焕先认为:“汉字的构形是有理性的,没有理性就产生不出汉字;而汉字的发展是破理性的,不破原有的理性就不能前进。”

五、部件的称说

根据上述定义,在产生部件清单之后,必然会出现许多没有命名的部件。部件是汉字应计算机输入而出现的基本单元的新命名,我们的学术界并没有,也不可能有预先给这些突然而来的部件设定名称。这些部件当然不便于称说,需要我们给它们命名。有人借此会说这些部件是“不完整”的。我们认为,世界上任何新事物不是先有名称,而后产生的,就象孩子一样,先生出来,然后才给他取名。部件有了命名,便于教,利于学,于识教育大有裨益。

部件清单中的有一些部件是成字,或者是部首,是有现成的名称,当然不需要再给它命名。余下的一些部件,有的是字的中央部分,或者是因它们的组字量少,没有“资格”当部首(例如“囬、  ……”),有的因为简化而产生的一些新的笔画结构块,但它们符合部件定义中的规定的属性(例如“ ……”),这些部件,我们都需要给它们统一命名。

如何给这些部件命名?我们认为在确定部件清单之后,可以采用与这些部件相关的汉字,以它们之中使用频度最高的字为依据,根据该部件所在的部位加以命名。给部件命名还要严谨,避免重复,例如“罢字头”不能说成“四”,“贾字头”,不能说是“西”,就是说,部件不容许混淆。


参考文献

1)陈代于等:《汉字音形码编码原理探讨》,载《中文信息通联世界论文集》108页。

2)蒋辅文:《汉字输入法不需再编程序即可装入视窗’95中文版运行》,载于《中文信息》1996年第3期。

3)王永民:《汉字字形编码的原理和实践》,《中文信息处理国际研讨会论文集》第二集,第23页,1983年。

4)苏培成:《现代汉字的部件切分》,载《语言文字应用》,1995年第3期。

5)钱玉趾:《也谈汉字部件和汉字字根》,载《语文与信息》,1995年第5期。

6)钱玉趾:《也谈汉字部件和汉字字根》,载《语文与信息》,1995年第5期。

7)晓东:《现代汉字部件分析的规范化》,载《语言文字应用》,1995年第3期。

8)陈爱文:《汉字编码的理论与实践》第12-13页,学林出版社,1986年8月。

 

《汉字编码设计学》目录

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有