汉字简繁体转换不能单靠电脑
苏培成
最近我读到了文化艺术出版社2010年10月出版的《〈说文解字叙〉王友谊篆书写本》,这本书内包括《说文解字叙》、《许冲上〈说文解字〉表》和《汉安帝诏》三篇文章的楷书繁体和篆书两种文本。篆书的书法很显功力,给读者以愉悦的享受,但美中不足的是无楷书还是篆书都有一些错字,据我的统计共有18处之多。例如(为便于印制,把篆书也楷化了):
“萬國咸寜,神人以和”误为“萬國鹹寧,神人以和”(楷书);
“萬物咸覩,靡不兼載”误为“萬物鹹覩,靡不兼載”(楷书);
“许沖”误为“許衝”(篆书);
“人持十为斗”误为“人持十為鬥”(楷书、篆书);
“徵禮等百餘人,令說文字未央廷中”误为“征禮等百餘人,令說文字未央廷中”(楷书、篆书);
“召陵萬歲里”误为“召陵萬歲裏”(楷书、篆书)。
这些错字是怎么造成的,我们并不清楚。该书的《后记》里说,书法家在进行篆书创作前,请电脑公司将这三篇文章里的字用电脑先做成篆书小样,供书法家参考。从错字本身来分析,这几个字都错在简繁体转换上。例如:“斗”本来是升斗的斗,读dǒu。汉字简化时用它来代替“鬥爭”的“鬥”,读dòu。在由简体转换成繁体时,不是所有的“斗”字都要转换为“鬥”;读dǒu时仍旧要用“斗”,不能转换成“鬥”。《说文叙》里的“人持十为斗”说的是在许慎生活的汉代,有的人胡乱解说文字,把升斗的“斗”解释为“人拿着十”,这里的“斗”不能转换成“鬥”。又如,在繁体字里,征讨的“征”和“徵召”的“徵”写法不同,而且这两个字的上古音和中古音也不同,只是到了近代才变为同音,都读zhēng。汉字简化时,用征讨的“征”代替“徵召”的“徵”。在由简体转换为繁体时,在表示征讨义时仍用“征”,在表示徵召义时“征”要改为“徵”。《说文叙》里的“徵禮等百餘人”是皇帝征召爰礼等一百多人,在繁体字里要用“徵禮等百餘人”,不能改为“征禮等百餘人”。
在《简化字总表》里,多数字是一个简体对应一个繁体,例如“书”对应“書”,龙对应“龍”。对这样的字进行简繁或繁简转换时不容易出错。可是《简化字总表》里也有几十组字是一简对多繁,例如“郁”对应“郁”和“鬰”,“淀”对应“淀”和“澱”。对这样的字,进行转换时要特别留意,必须明确要转换为对应的哪个繁体。
目前进行繁简体转换有人工转换和机器转换两种方式。人工转换时,从事转换工作的人必须熟悉简繁两种字体间的对应关系,特别要熟悉其中的一简对多繁。如果让不具备这种能力的人从事转换工作,就会出错。同样,用电脑进行转换时,使用的软件必须具备区分一简对多繁的能力。如果不具备这种功能,转换时就会出错。就笔者的有限见闻说,目前上市的转换软件,多数只能用来进行一对一的转换,而不能完全正确地进行一对多的转换。软件的智能化程度还不够。使用不具备一对多转换能力的软件进行转换,结果就会出错。这样说阿里,我们就不能用电脑进行汉字简繁体转换了吗?也不尽然,可以用电脑进行转换,但是转换之后一定要用人工干预,把转换错了的改正过来。如果不做人工干预,当然就会出问题。本文开头说的《〈说文解字叙〉王友谊篆书写本》里的错,就是在用电脑进行转换时,没有进行人工干预,所以我说“汉字简繁体转换不能单靠电脑”。当然以后如果研制出了智能化程度更高的软件,具备了完全的简繁转换能力,人工干预就可以省去了。我们期待着早一点能用上这样的软件。(编者按:本会会员赵功德研制的《汉语教学软件——功德结构输入法》在汉字简繁体正确转换方面已取得重大进展。)