阅读文章

从汉字信息处理看异体字整理

二、信息时代异体字整理原则和要求的实例说明

[日期:2008-05-10] 来源:语言文字网  作者:陈明然 [字体: ]

下面试以“并併並竝”、“匆怱”、“豆荳”、“蠹螙”4组字为例,对上述原则和要求作具体说明。

第一组:并、併、並、竝

《第一批异体字整理表》取4种字形中笔画最少的“并”为正体,把“併並竝”作为“并”的异体淘汰。在当时来说,是有一定的合理性的;但现在从汉字信息处理计算机键盘输入编码的角度来看,需要进行调整。

《说文》:“幷,相从也。从从,开声。一曰从持二为幷。”《汉语大字典》一卷242页,“并”条:“同‘幷’。”一卷408页,“幷”条按:甲骨文‘幷’字从从,从二,或从一,象两人相并形。”

“并”是“幷”的连体字元[4] 。《说文·从部》举“并”的字形为“幷”(小篆);睡虎地竹简中写成“并”;把“幷”的上下四个横笔连写成了两个横笔。现在我们要对“并”这个字形进行分解的话,可以有三种分解方法:前两种方法是直接按现用字形,一是分解为“”和“廾”;二是分解为“丷”和“开”;三是将其分体还原成“幷”后再分解为“”和“”。第一种分解法分解得到的“”和“廾”这两部分中,下方的“廾”可按“廾”字读为gong,但上方的“”读什么呢?读不出来,就不利于码元的提取,而且也明显不合字源字理;如果按第二种方法分解为“丷”和“开”,一是上方的“丷”没法读,二是不符合字源字理,容易使人产生“分开”的联想,不能表达“合并、并立”这一字义;又如果按第三种分解法,首先是不能从现用字形直接得出结果,需要经过“间接思维”,其次是得到的两部分都没有完整的音节,不利于取码。

“並”是“竝”的连体字元,是经由“竝”的上下两个横笔相连后把中间一撇一点改为竖笔而得。《说文·立部》:“竝,併也。从二立。”《汉语大字典》一卷246页,“並”条按:“竝字经典多作並。”四卷2708页,“竝”条:“同‘並’。邵瑛群经正字:“今经典作並,隶变。见汉夏丞、曹全等碑。”《集韵·迥韵》:“竝,隶作並。”在《说文·竝部》中,此字的小篆字形尚由两个“立”并立组成;在睡虎地竹简中,也还是写成左右两个“立”;在曹全碑中才被连体写成了“並”。所以,对“並”进行分体整理后,即得“竝”。

“併”这个字形,比“并”要接近信息时代异体字整理的原则和要求,但不如“竝”理想。

我们再来看“竝”这个字形,左右两个“立”,字元之间的界线十分清楚;“立”本身是一个常用字,不仅有完整的音节,而且凡识字者人人会读;“二者竝(并)立”的字源字理也很明白;笔画也不算多。所以,“并、併、並、竝”这四种字形中,应该说“竝”比较符合第一节所提的信息时代异体字整理的原则和要求。

第二组:匆、怱

《第一批异体字整理表》取2种字形中笔画较少的“匆”为正体,把“怱”作为“匆”的异体淘汰。

“匆”,《汉语大字典》一卷257页:“急促”。清朱骏声《说文通训定声·履部》:“勿勿,后人作匆匆……正字当作悤。”

“怱”,《汉语大字典》四卷2281页“怱”条:匆忙。《集韵·东韵》:“怱”,古作“悤”。

“匆”字不易分解,硬是要分,也只能分成“勹”和“”或者“勿”和“丶”。前一种分解法得到的“勹”可读作bāo,通“包”;但是“”却无法读,也就无法取码,只能主观地进行硬性指定,这样就必然增加编码的记忆量。后一种方法虽然在取码上没有问题(“丶”可读作“捺”),但却不能说明“匆”的字源字理。“勿”是“不要”的意思,“勿、丶”就成了“不要捺”,无法与“匆忙”联系到一起。在整字的字形上,“匆”和“勿”只有一笔之差,容易混淆。

“怱”的字元界限很清楚,可以十分容易地分解为“匆”和“心”;字源字理也很明白,上方的“匆”表音,下方的“心”表意,形象地点明了“匆忙”的心境;笔画数又不多。本文认为,较之“匆”来说,“怱”更符合信息时代计算机汉字处理的需要。

第三组:豆、荳

《第一批异体字整理表》取2种字形中笔画较少的“豆”为正体,把“荳”作为“豆”的异体淘汰。

按《汉字大字典》六卷3565页“豆”条的注解,“豆”除了“豆类作物”义外,还兼有“古食肉器”和“古代容器”等义。又五卷3215页,“荳”条:《正字通·艸部》“荳,俗豆字。”

《现代汉语词典》在把“豆”作“古代盛食物用的器具”义解时,没有将“荳”列为它的异体字;只在对“豆”作“豆子(黄豆,绿豆)”义解时,才将“荳”列为它的异体字[5]

在现代社会通用汉语中,“豆”一般只用作表示“豆子(黄豆,绿豆等)”;“古代盛食物用的器具”这一义项已经不用了。

“豆”、“荳”两种字形中,“豆”是从象形的“文”演变而来的独体字,难以分解;勉强要分,只能分成“一”、“口”、“”三部分。这三部分中的“”没有读音,给取码带来了困难,况且这种分解方法也不合字源字理,可以说是对整字的粗暴肢解。而“荳”却很容易分为读音明确的“艹(读cǎo)”和“豆”,上方的“艹”表义,下方的“豆”表音,而且笔画数也不多。由此,这一组字中,“荳”更接近第一节所述信息时代计算机汉字处理的原则和要求。

 

第四组:蠹、螙、

《第一批异体字整理表》中没有这一组字,但《辞海》和《现代汉语词典》都把“螙、”作为“蠹”的异体字;1990年重排的《新华字典》也把“螙”作为“蠹”的异体字。

《说文》:“蠹,木中虫,从(音kūn,作者注),橐声。螙,蠹或从木,象虫在木中形。”《汉语大字典》四卷2877页“螙”条:同“蠹”。并引梁启超《节省经费问题》:“螙日蛀木,木腐而螙安栖?”

由上可知:“蠹”字中“”以上部分是由“橐”简省所得的“省形字元”[6], 省形后其表音功能被模糊化了,不利于键盘输入时码元的提取。林夫先生建议以“螙”或“”作为这组字的正体字形(林夫,2001)。笔者十分赞同这个意见。“螙”或“”不仅能很明白地表示“木中虫”这个字义,而且字元间的界线清晰;容易分解又不违背字源字理;便于取码同时笔画数也比“蠹”要少得多。


[4] 同[2]。另可参阅陈明然《连体部件小议》,载蔡新中、何华珍主编《汉字书同文研究》第5辑,香港文化教育出版社2004年6月版。

[5] 见《现代汉语词典》263页,商务印书馆1983年1月第2版。

[6] 同[2]。



上一页 [1] [2] [3] 下一页   
【内容导航】
第1页:一、信息时代异体字整理的原则和要求
第2页:二、信息时代异体字整理原则和要求的实例说明
第3页:三、最后的话


阅读:
录入:陈明然

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:连体部件小议

下一篇:汉字书同文研究若干术语之管见
相关文章       汉字 
本文评论
  很好   (白羽 ,2009-06-01 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章