第七章 汉字拼形字母系统的建成 §7.1 部件清单之证明 康马杰说:“正确的思想就是我们能够吸收、证明、确定和证实的思想。而错误的思想就是我们不能够吸收、证明、确定和证实的思想。”“集中精力提出一种思想和理想,作为认识和纠正具体社会弊端的方法,而不是提出什么天国或遥遥无期而无法实现的目标。”(1) 当前我们极其需要的是部件清单,而这个清单是由部件的“个体”组成的。这些“个体”能否通过证明,证实它存在的合法性和合理性是问题的关键。 一、部件合理性证明的依据 我们已在第五章里遵照字形结构原理分析出部件的基本属性。部件既然有基本属性,那么它就不是“因人而异”的、任何人可以随意“优选”的。部件作为构建汉字编码设计学基础,不仅应该定性,而且应该定量。它的客观存在应该通过证明而得到。每一个部件,必需符合部件定义中所规定的本质属性。我们的部件清单里,还有个别部件不能获得证明,建议大家一起讨论,达成共识,不要因为个别的部件,否定整张清单。 运用部件定义的属性,证明部件产生的合理性、合法性,可以克服编码设计中部件产生的随意性。算不算部件,不应由设计人决定,只能由部件的属性来确定。表形码也存在着同样的缺陷,其中也有随意确定的部件。例如它表中的“”,是从“既”的右边拆出来,还把上面的一个横笔拆开。我们审查过所有汉字,如“既、暨、簪、谮、僭……”等,都没有发现“”可以“相对独立”存在。它与顶上的横笔,都是一起出现组字的,因此,把“”作为部件,学习者心理上就不容易接受。应该把顶上的横笔恢复,使“旡”成为一个部件。有人却认为“无”可以拆为“一、尢”,那么“旡”也可以拆。我们认为“无”字下面的“尢”,在“尤、优……”等字中随时可以见到,把顶上的横笔拆出,心理上是可以接受的。而“旡”却不存在这种情况。再如表形码的第一个版本只有三个组合部件“鱼、、钅”,到第二个版本,就有了八个组合部件了(如为输入方便,应在取码时解决)。这种随意确定部件,就无法进行证明。 按部件的两种属性,一个一个地证明部件的合理性,可以更好地完善部件清单,不使部件的产生和存在有个人成分,以有利学习和记忆。 二、部件清单证明的逻辑步骤 根据上述思想,证明工作分为三步: 第一步,把成字部件和新华字典中的部首(指两个笔画以上的“块”)先行“过滤”。根据笔者研究,这些成字部件除最后七个没有拼字能力的之外,在拼字时都是有多显性间隙的,在拆分时最符合认知心理。这些部件只要一张清单就可以。 成字部件125个,括弧中为字例: 一(旦)、乙(亿)、二(仁)、八(扒)、三(参)、川(顺)、小(尖)、火(炎)、心(芯)、六(冥)、立(位)、北(背)、兆(逃)、非(排)、主(住)、十(什)、力(加)、九(仇)、廿(庶)、甘(疳)、世(屉)、卅(带)、册(删)、中(忠)、丰(峰)、韦(伟)、申(伸)、串(患)、聿(津)、西(洒)、酉(酒)、井(讲)、弗(佛)、匕(化)、七(柒)、也(他)、屯(吨)、电(奄)、车(阵)、弋(代)、戈(找)、戋(钱)、曳(拽)、子(仔)、孑(孔)、口(唱)、日(暗)、曰(倡)、目(泪)、耳(职)、且(疽)、四(泗)、皿(盆)、母(每)、田(备)、尸(户)、尹(伊)、又(仅)、及(芨)、女(汝)、瓦(瓯)、臼(舅)、门(们)、刀(召)、乃(仍)、山(仙)、巾(帽)、习(翁)、夕(多)、巨(拒)、臣(宦)、月(朋)、丹(彤)、冉(髯)、人(合)、入(汆)、了(丞)、幺(幻)、弓(弘)、片(版)、爿(寐)、豕(家)、厂(仄)、广(庆)、大(奋)、夫(扶)、夷(姨)、央(英)、丈(仗)、史(驶)、吏(使)、木(休)、末(沫)、未(味)、本(体)、耒(耕)、束(刺)、果(颗)、柬(楝)、儿(兄)、几(殳)、虫(蚕)、禺(偶)、丁(叮)、不(杯)、干(杆)、于(吁)、甲(押)、上(让)、止(址)、士(仕)、土(肚)、由(宙)、工(攻)、正(征)、王(狂)、五(吾)、里(狸)、事、乜、曲、孓、凹、凸、毋。 所谓部首都是指有相当数量的拼字能力,同时有明显的显性间隙。部首(47个): 丷、冫、刂、彡、氵、巛、⺌、 灬、⺗、爫、讠、亠、礻、衤、艹、廾、肀( )、扌、覀、罒、囗、卩、阝、夂、攵、厶、凵、匚、冂、冖、宀、⺈、、勹、彐、、、犭、疒、廴、辶、尢、、忄、亻、纟、。 第二步,有许多非字部件,由于拼字量不高,或因构字时位于汉字的中间,没有被选为部首,但它们也带有明明的间隙,可一目了然看出,在拆分时也很容易认知。这些部件需要举出一些例字来证明,例如“”,它与“广”构成了“庸”。有的部件,如“”,它在“已”中是粘连为一块的,但在“假”字中,有明显间隙,因此,把“已”字拆为“、乚 ”,在心理上可以接受的,何况,“己、已、巳”三个字,都是靠“”在“乚”的竖笔上上下移动而得以区别的。因此,它们的拆分心理上也是可以接受的。 有明显间隙的部件(147个) 第三步是余下的一批带有隐性间隙的部件(50个)。证明这一批部件的方法可以用下面的表格:存在间隙的理由分为:①在基本结构外的单独撇笔;②不同的笔画走势;③与成字部件或它们变体相接;④两个不同的笔画结构;⑤戈字类部件的横笔左右两用。 有隐性间隙的部件(50个) 三、部件清单的拓展及难题 我们已经把本部件清单中的368个部件证明完毕。这张清单中的部件,是从国标二级字库的6763个汉字里分解出来的。利用汉字的天然间隙从汉字中分解出部件,当然最符合认知心理。今后不管汉字集如何扩大,这种分解方法,照常可使用于任何一个新增汉字,不管它是日本汉字或南韩汉字;不管它是地方汉字或繁体字;不管它是现代简体字,或古老的死汉字。因为,所有的汉字都是由部件以拼形的方法造出来的。利用“笔画结构块”的概念,对新增加的少量的部件,按它们的结构和特征使它们“对号入座”,任何一个新部件,都离不开七个基本笔画结构类型和本部件表中的48种特征类。笔者曾经试编过含有20902个汉字的字符集,大约要增加60个左右的部件就可以了(见附录三)。 根据以上分析,368个部件中,只有“、、、、、”六个无法得到证明,其中三个是单笔部件。“、”无法从任何一个汉字中得到它具有“相对独立性”的证明。“”仅拼出“丐、钙”两个字;“”仅拼出“尺、迟、尽、久、灸”等几个字,要不要拆出作为部件。如果觉得不妥,也可以把“丐、尺、久”都作为部件,列入部件表中,需要大家认真讨论,是增加两个单笔部件好,还是增加三个笔块部件好。总之,必须进行科学的、有依据的考虑。“、、、”是一个死结,来自“舞、羌、丑、巴”以及由它们所拼出的如“扭、钮、爸、笆、把……”等字,怎么办?要作人为规定。我们的意见是“”下面的一横应该拆掉,因有利于分入相交型,这样也有利于拆分;“丑”可作为一个部件,或者拆为“、十”两个部件;“巴”应该拆为“、乚”两个部件,因有利于拉长码位。拉长码位,使汉字形成线性形式。汉字内部的部件排列,实际已含有线性,只不过不象拼音文字那么明显而已。只要我们按每个拆出部件的第一个笔画的先后,顺序排列这些部件,它的线性就昭然了。 |