§4.2 历史性原则 “历史的探索,对于立志为人类服务的人来说,从来都是服务于改革当前现实和规划未来方向多。” 历史性原则,就是汉字编码的设计必须系统地研究和遵循汉字在造字、学字、用字、检字的历史过程中展现的历史规律,发展原理;理解汉字字形编码方案的历史发展,了解设计编码的历史使命。 汉字字形编码的研制和研究是我们现阶段的历史使命。搞得好功在千秋,搞不好遗害万代。因此,我们必须充分惦量这一神圣历史使命的分量,认清这是一个不能推卸的千斤重担,而绝不是一个发财致富和沽名钓誉的机遇。 回顾汉字演变的历史经验,汉字字形检索系统的发展过程,汉字基本单元概念的形成,以及汉字字形编码方案设计的成熟之因;研究汉字从拼合使用,又“回归”到拆分使用这一历史演变过程。从中寻找它的发展轨迹,理解它的必然趋势,有助于选择和完善汉字字形编码的设计,有益于计算机中文应用进入基础教育系统,有利于计算机中文应用迅速按正常渠道进入千家万户。 编码的应用,具有强烈的阶段性。现在这个阶段,正是计算机机向家庭普及的时机,我们若不能及时提供有效鉴识方法,及时研究提供比较科学的方案,就会延误战机,遗害深远,我们将无法面对历史的责问。因此,我们应该全面地、系统地研究这次变革形成的历史原因,历史条件(动力)和历史机遇。 四五千年的实践应用,汉字的发展和壮大,符合中华民族语言应用的实际 。周朝统一全国,分封八百诸候,那时没有普通话的推广,尽管讲着各种听不懂的方言,他们却能通过表意的文字,传递、交换和理解相互之间的信息。现在我们研究和研制汉字字形编码方案,当然不应该脱离这个实际,忽视编码设计的历史性。否则,就会一无所成,并会造成不可估量的损失。 贯彻历史性原则的要求是: 一、编码必须遵循汉字演变 的历史规律 (一)汉字史是“字理”逐渐淡化的历史 “汉字本身的发展史,就是一部逐渐淡化自己‘字理’的历史。这就是说,死守字理,汉字就不能发展;死守老祖宗时的字理,汉字就不能适应当代语言和应用的现实。”⑸汉字的“字理”历经几千年的淡化,基本上已经消失殆尽了。所以,我们在现在这个汉字剧变——拆出部件清单——的关键时刻,应该既遵循汉字部首的理性,更要敢干挣脱其束缚,逐渐淡化并摆脱它的旧躯壳,只有这样,才能使它的应用效能,得到更进一步的发挥。 “淡化字理”就是淡化象形、会意、指事、形声等造字的理。甲骨文里有许多字都可以运用“六书”来解释,但现代汉字却很难这样解释,因为,它们基本上已经符号化了。虎不再是“”,而是由“、七、几”三个拼字单元组成;鱼不是“”,而是由“⺈、田、一”三个拼字单元组成。而且这两个字之中还有“七、几、田、一”四个是成字。它们还参与组成许许多多其他的汉字。字理的“淡化”,实质就是拼造汉字基本单元的符号化。所谓“符号化”就是指原来“依类象形”造出来的“独体”,不再与过去一样的“象形”了,它们成了约定的符号。 文字是记载信息的书面符号。从原始的造字材料——图形符号(独体),发展为现代的汉字拼字单元——部件,再由部件归类为汉字检索符号,这个历史过程值得我们重视,它们的经验和蕴涵其中的规律有待我们去总结和探索。 (二)汉字演变的历史经验 古代的甲骨文,经“篆化”、“隶变”,到现代的楷书,经过了多次变革。这些变革,都是为了要实现促进信息交换的速度。随着人类文明的发展,为了提高信息交换速度,社会要求字体规范、书写方便,但是,它受到书写(包括印刷)工具的牵制。因此,当新的书写工具产生后,字体的变革便随之而来。这一历史性趋势如下表所示: 字 体 | 图形符号 | 甲骨文 | 金文 | 大小篆 | 隶书 | 现代汉字 | 部件 | 检索符号 | 构字单元 | 线 条 | 笔 画 | 键盘符号 | 方 法 | 拼 合 | 拆分 | 分 类 | 书写工具 | 刻 刀 | 笔 | 键 盘 | | | | | | | | | | | |
上述变革,最重要的是篆书改为隶书,平直的笔画系统取代了圆曲笔;一些连体篆字,变成了裂体隶书,一个字分成了几个相对独立的“块”。这无疑是一次重要的、面目全非的变革。发生这次变革的原因,首先的国家的统一,社会生产与文化的发展,需要加速信息交流;还需要更多的文字以表达不断增多信息。连体篆字存在着书写、造字、记忆和规范等困难;而裂体文字却有最简单的造字单元。例如篆字的“”到隶书的“”,我们可以看出 “鹿”从连体字,裂变为四块。用这些简单的“块”来造字,比复杂的“文”来造字,要方便得多。 其次是书写条件的变化,历史进入了了以毛笔写字取代刀刻写字的时代,隶书平直的笔画非常适合毛笔书写,写字的速度大大提高,信息交换速度和交换量也同时得以大幅度的增长。隶书的笔画系统取代了篆书的园曲笔,有利全社会的文字规范。这次变革也说明了汉字在进一步地淡化自己的字理,进一步地符号化。 从上述汉字变革过程的简单回顾中可见,汉字演变的历史性规律主要是: 1.历史的发展,信息的积累,和信息交换的数量增多、速度加快是引起汉字的发展和变革的外部条件; 2.写字工具的改变,为信息交换的速度加快提供了物质基础,而成为汉字演变的内部动因; 3.从原始图形的连体符号到现代字形符号系统,汉字字形中出现了分隔沟,分成了相对独立、便于称说的块(即部件),这是汉字发展的必然结果。 上述规律说明任何文字变革的愿望都必须有一定的物质——书写工具作基础;汉字形体的新陈代谢,汉字的笔形变化,并不影响汉字的造字方法。可见不管汉字如何变革,都应该考虑它的物质条件;同时不背离汉字造字法的基本原理,不放弃汉字造字法的拼形优势。 所谓汉字的拼形优势是指与拼音文字相比,汉字既具有符号性,又具有形象性。它的符号性由于我们到现在还没有办法彻底拆分并确定汉字的部件清单,所以,有的人会觉得与拼音文字相比,需要付出较多的记忆量;但是,这些人忽略了汉字又具有形象性,当学习的人掌握了一定数量的文字之后,可以望文知义,更便于学习、便于联想、关于组词,就会觉得前期虽然付出较多,而后期却能得到比拼音文字有更多的方便。 在20世纪90年代,计算机技术使中华民族面临着写字工具和印刷工具的一次应用的大变革、大合龙。与以前的所有汉字变革不同,今天的汉字变革,是把它由拼合变为拆分。我们研究,尽管变革的方式不同了,但变革为原则仍然没有改变:汉字的拆分法,不能影响部件结构本身。因此,研究汉字的字形结构和汉字部件结构是汉字字形编码方案设计的基本途径。汉字的字形结构的根本是“拼形”;汉字部件结构反映的是汉字笔画与笔画之间的结构关系。这就是我们从计分编码研究中得到的启示。 (三)拼形造字、拼形文字与拼形字母系统 形声造字法的出现后,无论社会如何发展,无论有多少新的信息出现,凡是有造字的需要,新的字就会立即产生。形声造字法突破了象形、指事、会意等造字法的局限,使汉字的造字系统趋向完善。因为现在需要多少字使用,马上就可以造出来了;它又使学习的人,能基本知道字的读音和意义,有利于学习、记忆和使用。从象形到形声,汉字走上以音造字的差距,有利于更快地出新字,更快地表达新的信息(但并不能因此证明拼音化就是必然之路)。文字虽然越来越与语言相适应,但文字也可以独立表达和传递信息;比之语言,它使古代人类文明克服了时间和空间的限制而得到延续和发展。 造字法受应用和学习制约,应用要求造字法能随用随造;学习要求造字法造得易学易记。象这样一个庞大的汉字系统,百分之八十以上是用形声造字法造出来的。古代文字学家把汉字的造字法归纳为“六书”,这是他们从“义”的角度构思出来的。字形编码的实践告诉我们,“六书”在“义”的角度上构筑字理,已经不适合“拆字编码(即字形编码)”的需要。用部件(不是部首)来拆分汉字,不能再依据字音和字义,只能就构形来考虑。因此,我们必须从新的角度,考虑和论述汉字的造字方法,提出新的文字概念。 “隶变”之后,有许多字体结构发生了“裂变”,另外又有少数汉字发生了“聚合”(几个“独体”拼合的串在一起了),“独体为文,合体为字”的构字理据也讲不通了。使用象形、指事、会意或形声等已无法解释许多现代汉字的形成的原因了。发生“裂变”的汉字,部件之间的间隙更加明显了;发生“聚合”的汉字,更不能按字源原则论拆分了。时代需要一种新的概念。 根据我们的研究,如果从单纯的“形”的角度,把汉字的造字法概括为一种,即:拼形造字法。那么它就可以涵盖一切汉字。如“刀、口”为“召”,“召”是形意字,也可以认为它是“刀、口”两个“形”拼合构造出来的。“召”为声,加“扌”为“招”,加“日”为“昭”,加“氵”为“沼”……都是形声字。但同样也可以说它们都是“拼”出来的。“刀、口、扌、日、氵”则是“拼形”的基本材料——部件。既然可“拼”,当然可“拆”。哪里相拼,从哪里拆开。造字的理与拆字的理当然应该是一致的。“拆字编码”的出现,是历史发展的必然,是汉字的内因和外因在现代时空条件下的必然产物。拼形造字、拼形文字、拼形字母系统,这些概念的产生,下随着拆字编码而来的必然结果。用“拼形”法造出来的文字,就可谓之“拼形文字”;构成拼形文字系统的基本单元,就可称之为拼形字母。为实现汉字序性化所需要的部件分类、排序、映射等构筑出来的系统,就称之为拼形字母系统。这是字形编码设计发展的必然结果,不是某些人心血来潮的产物。 拼形文字与拼音文字的不同是: 1、拼形文字同时具有符号性和形象性。由于拼形文字的符号比拼音文字多十余倍,所以,有的人认为它“难学”;形象性却使学的人易学易记,有人就认为它“易学易用”。 2、拼形文字按笔画顺序将它的部件加以“块”式组装,不象拼音文字那样有明显的线性,只具有隐线性。隐线性需要加以解释,人们才能一目了然地看出它的线性排列。 为了实现汉字现代化,一个世纪以来人们朝思暮想要提高识字速度,直接翻页检字,为此尝试作拼音识字、字形排序等长期努力的实践。特别是计算机进入我们的生活以后,几千年沿用的无序的、不能拼的、非线性的汉字,表现出它无法适应现实的无奈。在键盘不仅将取代纸笔,也将替换全国所有的印刷工具这一严酷现实面前,变革成了唯一的出路。 键盘输入,从实用上看,是汉字书写方式的改变:用十个指头,象弹钢琴似地一键一个部件(代码),打出一个甚至一批汉字。书写工具带来了书写方法的变革,也引来了汉字的变革。这个变革的方式,就是汉字字形编码的汉字拆分。 (四)汉字拆分是汉字史上的奇迹 键盘上只有几十个有序的符号,它只能依靠排列组合形式来表述上万个方块汉字。汉字的字形信息要换为键盘符号,必须进行拆分才能转换。 汉字从少数的“文”,经拼合而不断增多,沿用了几千年。现在我们又要拆分它们,把它们分解为部件,经历一个由“合”至“分”的变革过程。纵观汉字发展的历次变革,都是笔势的变革,不是结构本身的变革。而现在的这一次变革,牵涉到汉字本身的结构——将整字拆为部件。拼合造字,它的“能量”积累了中华民族五千年的文化科学信息;拆分使用,则能使我们迅速进入一个文化科学信息大爆炸的新时代。历史的发展证明:汉字的聚和分,是汉字时空运动的最本质的模式,当然也是任何事物运动的基本模式。 社会发展趋势表明,未来的世界,信息量将剧烈增长;同时电子计算机技术将得到高速发展和普遍应用,并将联成世界网络。汉字编码将要成为世界性的信息传播载体。汉字作为文化和信息的“基本粒子”,需要在汉字编码的“加速器”上撞击,制造出更微小的新粒子——部件,以便适应信息量激增和电子计算机技术的高速发展和普遍应用的需要。因此,我们需要拆分汉字和使用它的部件,并为之编制有序的符号系统。 不能小看汉字拆、部件使用和汉字序性化,这些事在汉字史中将比“隶变”有更深远的影响。因为,几千年的汉字发展,都是在不断地拼合增多的,而今一反以往,把拼合变为拆分,解决汉字识读的困难;部件分类,取得代码,使汉字弥补了几千年来排序检索的不足,同时适应现代文化普及与计算机应用的需求,其历史意义亦应惊天地而泣鬼神。 汉字,从原始的图形符号,经不断拼合,应用至今,已经发展成为一支庞大的队伍——六万多个,现在却需要拆分应用。拆分汉字,使用部件,使中国人告别依靠右手执笔,一笔一画艰难地书写一个个汉字的历史;而使用键盘以几倍甚至几万倍地提高信息交换能力。汉字拆分,将展现汉字史上的奇迹。 二、编码必须遵循字形检索演变的历史规律 (一)部首检索无法构成一个严密的系统 部首检索始于《说文解字》,采用540个部首,分为14部(每部又分上、下两部,应算28部)。归部(类)的方法采用字义集合。例如“一、上、示、三、王、气、士”为第一部(上),据释:“惟初太始,道立于一造,分天地化成万物”,“上、示、三、王、气、士”都是由“一”产生出来的,所以就有理由合并成一部了。这种从哲理上的解释归部(类),没有古文学基础是没办法理解的。偏偏查字典的人都是因需要知道字义,已经理解的人就不必再用它了。何况,即使知道某个部首,要从28个类中找到,还是极其困难的。《说文》的这种不科学的归类法从东汉一直延续到明代,梅膺祚著《字汇》,一下就砍去了300多个,但人们还是感到不方便。 现在的部首检字法用笔画数分类。笔画数是有序的,按字义集合改为按部首的笔画数集合,检字的第一个梯级解决了。分类的目的是为了有机地离散部首,使其有利于检索。但是,由于笔画数与字义没有内在的必然联系,它只能走到第一级,第二级就没有办法再走下去了。 据统计,《新华字典》中189个部首中,2笔到5笔的部首共有125个,而8笔到12笔的部首只有18个。这个数字说明用笔画数分类的不均匀性。相同笔画数的字集中在一堆,数过笔画后,也还需查找;四五个笔画以上的或者有折笔在一起拐弯的,就不能一眼看出,要一笔一画地数。这样就麻烦了。 部首笔画检字法是在汉字字义的基础上产生出来的。字义不具备序性,运用笔画数分类也不科学,就会使人感到不满意。问题在于汉字字义的改变,都是依靠字形和笔形,例如“匕、七、乜”,都只有两个笔画,其中有一个笔画形状不同,字义、字音就完全不同了;“日、曰”,同样的笔画数、结构、笔形,一个长,一个方,仅仅只这么一点差异,字义、读音,也不同了。 《新华字典》的189个部首中,还含有基本笔画和许多没有字义的“笔画结构块”,照理它们都没有“资格”叫部首的。这说明它里面的构成成分不再是纯粹的部首了。字典检字,是普及识字教育的一个重要工具。外国人的字典检字,可以一次到位。中国人的字典检字,却需要拐几个弯:笔画数——部首——笔画数(除部首外的另一部分)——需检字。有的字笔画数很多,一笔一画地数,是很麻烦的;有的字不容易确定是什么部首,就成了难检字。使用部首是手段,当手段不适应历史发展、不适合应用的需要时,人们为了对付应用,必然不断探索更换它的方法。四角号码率先采用汉字四角笔形,代之以数字,扔掉部首,实现直接翻页检字,尽管方便得多,但不能取代部首检字。这是因为: 1、新的检字法多多少少总需学习和记忆,而部首检字法经几千年的补充改进,基本上不需学习和记忆; 2、汉字大多数都是形声字,见字可以基本上知义知音,避免了检字的麻烦; 3、新检字法没有经常使用的必要,就不可能进入识字教育课程,不容易被社会普遍使用,已经得到使用的检字法不能够被取代。文字检索的社会使用具有择一性,即社会全体人员只需选择一种,多了没有用。即使有最好的新检字法,也不可能换掉部首检字法。 但是,部首检字的设计依据是字义。字义无法定出切分的标准,不能进行定量。因此,许多字典都可以自己决定选择。作为一种检字法,它的基本材料——部首,可大可小,可多可少,就无法构成一个科学的、严谨的、严密的系统。 (二)部首检索已正在向字形检索演变 当前社会需要汉字能够排序,笔画数——部首检字法却不能成为汉字的排序法,因为部首本身没有序性。部首分类依靠的笔画数,它不是部首的本质属性。 汉字发展了三千年后,已经造出了上万个,还一直没有办法检索。直到东汉末,许慎著《说文解字》,采用部首检字法。尽管这样的检字法检字仍然十分困难,但它在汉字发展史上毕竟跨出了从无到有的第一步,无疑树起了一个前无古人的里程碑。许慎的贡献和中国人的崇古心理使文字学界对许学的尊崇到了是无以复加的地步。 自汉末到现在,这二千年来汉字的检索领域一直被“部首”占领着。明代梅膺祚著《字汇》,将部首减为214个;现代的《汉语大字典》,又减为201个;《新华字典》再减至189个;王竹溪教授的《新部首大字典》更减到56个,只剩下十分之一,仍然还算是部首,谁也不敢打新“旗号”。 减少部首,当然是为了有利检索。为什么有利,道理在哪里?没有人曾经作过明确的解释。知其然,不知其所以然,这是中华文化熏陶下的中国人的通病。所以,蒋梦麟先生说:“在中国,发明通常止于直接的实际用途。我们不像希腊人那样肯在原理原则上探讨,也不像欧洲人那样从个别的发现中归纳出普遍的定律……中国人一旦达到一件新发明的实用目的,就会马上止步不前,因此,中国科学的发展是孤立无援的,也没有科学思想作为导向的明灯。科学发展在中国停滞不进,就是因为我们太重实际。”从20世纪20年代,四角号码对部首检字发起了一次全面的“冲击”起,到1948年,全国就发表了近90种检字法方案。中国人只愿意搞实施方案,不愿意进一步追究这些方案背后的原理原则。 近几十年来,字典检字增加了音序检字法,检常用字方便多了,但它也不能取代部首检字。因为,音序为读音所局限,不认识就没法检。现代字典只能把两种检字法合在一起,互相补充。现在的小学里,儿童的识字教育,部首教育也参入其中,无形中增加了儿童的学习负担。因为,在此之前,小学里没有授教部首的教育内容,而所有识字的人,也能以部首检字法检字。部首教学的唯一收获,是难检字比较容易检到,例如“丑”,经过学习,人们会知道它的部首是“”。然而,在字典里检字,大多是为了查字义或由该字所构成有关词语的词义。而在识字教学时,老师是会把字义或词义事先解释清楚的,因此,对于已经认识的字,授教部首没有多大的实用意义,也可以说是多余的。 近代的部首检字法,与《说文解字》相比,部首数量大减,而检字却方便了,其道理在于: 1、采用了笔画数分类。利用笔画数的递增,使部首分类有序化了。字义分类是无序的,人们不易查找需要查找部首的类;笔画数是有序的,只要点好需要查找的部首的笔画数,就可以马上找到该部首。 2、增加了“横、竖、撇、点、折”5个基本笔形作为检索部首。这5个新“部首”使不易划出部首的需检字,可采用它的第一个始笔作部首来检字。 3、有笔画数作基础,形象相似的部首就可以进行合并,减少部首分析的麻烦。(这种替代法实质损害了汉字字形的规范性、不可替代性。) 分析上面所述,笔画数分类、基本笔形作部首、按形象相似合并,这三者无一不同字形有关(笔画数和基本笔形都是字形的属性),与字义却毫无关系。现在的部首检字法之所以比过去方便,是因为人们舍弃了字义信息而代之以字形信息。 再如《新华字典》所列出的部首分析,从中也可看出字义检索已被割裂得“体无完肤”了。例如: 1、5个(包括“乛、、乚”,实际有8个)单笔画,它们都是没有字义的。假设“一(横笔)”是有字义的,“一”是一个表明数量的词,代表“1”。而它能够检到“于、面”这样的字。“一”与“于、面”的关系不是字义上的,而是在字形上的,它们的第一个笔画都是横笔。其他的字都可以类推。 2、两个笔画以上的,如“十”作为“古”的部首。“十”与“古”,也只有字形上的联系,不存在任何字义上的关系。其他的可以类推⺧。 3、合并的部首有21处(繁简合并不算)如:卜、八丷、人入、⺈刀、几、卩⺋、彐、己巳、子孑、曰、水、牛⺧牜、爪爫、月、礻示、肀肀聿、毋母、艮、竹 、羊 ⺶⺷、西覀,其中只有“爪爫、礻示、竹 ”,可以认为有字义上的联系,其他18处都是因字形相似而合并的,占总数6/7。 部首检字法之所以要改进是因为它没有序性、不科学,不能构成一个严密的系统。文字学是应用科学,如果不符合应用的需要,那么它的核心——字义,就会被不断地修正。当前事实正说明部首检字法发展到现在,不再是纯粹的字义检字,已经大幅度地转向字形检字了。 (三)成熟的汉字字形编码必然取代部首检索 自计算机进入了我们的生活,汉字编码方案不断涌现,每一种编码方案都可以被认为是一种检字法:只要学会每个字的代码,就可以用它来检字。有的设计者也认识到要推广编码方案,占领教育市场是最重要的,编制字典是进入教育市场最根本的一着。但是,以字典作为推广编码的工具,应该具备四个条件:成熟的编码设计;优良的编写质量;强大的经济实力(用于宣传和长期坚持);广阔的发行网络。四者不可缺一。然而几乎所有的编码设计者都不可能同时具备四个条件,其中最根本是第一条。因为汉字编码的设计,尚未建立起统一的公认的标准,人们无法判别它们的成熟与否。 许多编码设计者并没有理解,设计编码是为了给汉字排序,而不是为汉字检索。不理解编码设计的目的,就不能设计出成熟的编码方案。 汉字检索与汉字排序是两个不同层次的概念。能检索,不一定能排序;能排序,一定能检索。汉字的检字法本来就应该是排序法。但部首检字法却不是汉字的排序法,它不利于现代应用。设计编码方案的目的,就是想以汉字的排序法取代老的部首检字法。如果说每一种汉字编码方案都可以作为汉字的排序法,必须有一个前提:要预先知道每一个字的代码。因此,以最少的学习时间,知道任何一个汉字(认识或不认识的)的代码,即见字即能知码,就可以作为判断一个编码方案的成熟与否的条件。 经过许多人的努力,我们取得了字形编码的实践经验:将汉字拆分为部件,部件对应有序的代,就可以使汉字获得序性。有的方案用部件的笔形,转换为数字代码,利用数字的序性。但笔形只是部件字形的一部分,还要通过数字转换,才可以检字,或为计算机应用。这种“部件——笔形——数字——键符”的转换方法是间接的,它给学习、记忆带来了困难。只有使“部件——键符”直接转换,利用键符的序性,就可以使汉字直接排序,并能大幅度降低学习时的记忆负担。有的编码设计者也这么做了,但效果并不理想。主要原因是这些方案中使用的部件,只选取了汉字集中的一部分(美其名为“优选”)。从信息交换的观点,要想使部件能完全反映一个汉字字符集的全部信息,必须拿出一张有效的、能覆盖整个字符集的部件清单来。任何“优选”方法,都只能创造不合格的编码方案。 汉字含形、音、义为一体。形,是音和义的根本,是载负音、义信息的载体。信息时代需要一种能反映全部字形信息的部件清单。只有这样的清单,才能全面反映全部字音和字义。一张能反映全部字形信息的部件清单,还必须有科学的分类系统,能作序性排列、采用部件与键符形与形直接对应方法的完善的汉字字形排序法(也就是一种成熟的字形编码)。所以,我们应该理解从四角号码开始,中国人走的是使汉字字形实现排序检索的变革路程。这一变革的发展成熟的标志是: 1、从全字形剪取部分信息对应代码,演变为拆分为部件的全部信息对应代码,实现字形全息性; 2、在转换方式上,是把“数字——笔画(笔形)”的间接转换方式,演变为“拉丁字母——部件”的直接转换方式。从四角号码到表形码,终于实现了汉字字形的直接排序。 3、在转换方法上,是从无理转换转向有理转换。大幅度地降低学习的记忆量。 由此导致汉字实现全面拆分和直接排序,它光在教育上的得益就不可估量:首先是儿童从小就学习汉字的拆分和拼合,能快速给汉字排序、检字和作计算机汉字输入;其二是通过部件教学有利于识字教育的字形结构教学规范化;其三是利用部件拼形认字,可培养儿童形象思维能力和组合能力;其四,解决了全社会的图书、档案、资料等检索的统一。 汉字编码设计方法的完善,需要从实践上升为理论总结,而后再返回实践这么一个过程。当人们寻找到一个成熟的汉字编码方案之后,编码检字必将最终取代部首检字。这是因为:计算机中文应用需要汉字编码;键盘写字必将取代用笔写字;汉字编码虽然需要花费学习和记忆的时间,但可以从计算机工作中收回更多的时间。因此,一个成熟的汉字编码就能够全面进入识字教育系统。成熟的字形编码就是完善的汉字字形排序法,它必然要取代不完善的部首检字法。 三、编码必须反映汉字基本单元演变的历史经验 古文字学家没有告诉我们上古时代汉字的基本单元——独体字有多少,现代所发掘的4500个甲骨文还只能认得一千来个,其中绝大多数当然是合体字,而不是“独体”。其中有多少是“独体”,他们也没有办法搞清楚。但是,我们以这些甲骨文结合现代汉字,可以看出汉字基本单元的演变: (一)古代有些拼字的“独体”,一个就演变为现代多个不同的拼字单元:“止、、辶、、屮、”等,都是由“(足)”演变而来的,例如:“”即步字、“”即逐字,“”即定字、“”即出字、“”即韋字;“扌、廾、又、、彐、寸”等等,都是由“ (左右手)”演变而来的,例如:“”即扫字、“”即弄字、“”即殳字、“”即具字、“”即书字、“”即专字。 (二)古代的某些“独体”,自身裂变为多个不同的、相对独立的拼字首。这些拼字单元,又与某些“独体”演变的拼字单元重合。如“虎、鹿”等甲骨文里写作“、”。 (三)古代的合体字演变为不可拆分的现代“独体”。如“吏、秉、韦、尹……”,甲骨文里写作“ ……”。 综上所述,汉字经几千年演变的结果是:许多“独体”不仅“面目全非”,还成了多个不同的“种属”;有的“因体”则发生了“内部分裂”,不宜再把它当作基本单元;有的“合体”反而“紧密结合”得不能拆分了。因此,再以“独体为文”来框定现代汉字的部件,以古代的字源原则拆分汉字就太不合适了。 从古老的甲骨文中我们探知:“独体为文”只适用于古代多少数指中或会意字(或可合称形意字),根本不适用于现代汉字。而且,汉字的发展增多,主要采用形声拼合,虽然大多数是左形右声,或上声下形……,但由于声(字音)亦是由形而成,一个声(字音)可能是一个形,例如以“口”为声,拼成“扣、叩”;也可能是多个形,例如“刀、口”为“召”,以“召”为声,拼成“昭、招、照”。这种古代的构字原理更用不通了。 几千年来,人们对拼合汉字的基本单元,曾作过多次探索,有过多种命名,诸如部首、字元、字素、字根……等,由于历史条件所限,没有人能够拿出一张能拼出全部汉字的基本单元清单。“独体”象一个幽灵,人们既不能得到,也无法摆脱。 近代国内外许多人开始了分析汉字的方位结构研究,有的人把汉字分为17种图形、49种图形、68种图形、100种图形等,还可以分得更细。方位图形到底能够分为多少种,能否形成序性?答案是:无规律可循。有的编码设计人也采用这种图形分析信息,把字形结构的关系分为:上下型、左右型、其他型。以1、2、3为代号,作为区别信息使用。图形分析没有带来图形结构规律,却启迪人们摆脱字义的方法:汉字造型的基本单位是几个相对的独立的“块”。一个全新的概念——部件——脱颖而出。 从部首——字根——图形分析——部件,我们又汉字基本单元的认识逐步深化。陈爱文先生对“块”的阐述,完善“块”的概念,为汉字字形编码方案设计的成熟提供了条件。 汉字的造字历史,延续了几千年,图形线条变成平直的笔画,形也不再是原来的形。从甲骨文到现代汉字,演变得面目全非。例如“氵”没有一丝一毫水的形象,只能说是水的一个代表符号而已。这就是说,构成汉字的基本单元已经符号化了,我们不需要再在字义、字源上纠缠不休。 汉字在漫长的历史长河中不是静止不变的,它的字形、检索方法、基本单元等,都在不断地发展变化着。这种变化都遵循着一定的客观规律。这些规律就应该是汉字编码——汉字变化的延续所必须遵循的。 |