(一)“非对称简繁字”的概念及主要论著
所谓非对称简繁字,是指一个简化汉字对应两个或两个以上繁体字,每一组这样的一个简化字和其对应的多个繁体字就称为“非对称简繁字”,又称“非对称繁简字”或“不对称汉字”[1]。
例如:“板”和“(地)板、(老)闆”就是一组非对称简繁字。
改革开放以来,我国大陆与我国港、澳、台地区及世界上其他国家的交流日益频繁。由于我国港、澳、台地区和居住在其他国家的许多华侨习惯使用繁体字,在书面文字交流中需要通过计算机进行简繁转换。但是非对称简繁字的存在,往往使计算机在进行简繁转换的过程中产生一些错误,譬如“发展”成了“髮展”;“复杂”成了“復雜”;“反复”成了“反複”;“皇后”成了“皇後”;“理发店”转换成“理發店”等等。为了消除类似错误,还需要人工对计算机转换后的文本逐字进行检查,大大降低了信息交换的效率。
十年来,许多沙龙成员进行了关于非对称简繁字问题的研究,主要论著有:冯寿忠《繁简转换的障碍应当清除——谈对非对称繁简字的调整》和《“非对称繁简字”对照表》、汪化云《非对称繁简字整理问题初探》、项菊《非对称繁简字整理刍议》[2];詹鄞鑫《试论“非对称繁简字”》[3];倪永宏《非对称繁简字亟待整理》[4];周胜鸿的《非对称繁简字规范化整理的学术探讨》[5]和《非对称繁简字是信息时代汉字走向互联网的瓶颈》[6];孙德平《Microsoft OfficeXP中文简繁转换中非对称性繁简字的使用》[7];李牧的《两岸汉字字形的比较与分析》;蔡雪雯、赖国荣的《试论简繁字之调整》,沈克成的《汉字简繁转换方法新探》[8];王敏東的《不对称汉字在台湾接受度之调查》;此外,詹鄞鑫在《关于简化字整理的几个问题》[9]一文中也有相关论述。
(二)非对称简繁字研究的主要内容及代表性观点
1.非对称简繁字的成因
非对称简繁字是在50年代的汉字简化过程中形成的。
1)合并简化:在汉字简化过程中,把两个或两个以上繁体字简化为同一个简体字,如“歴、曆”合并简化成“历”;“當、噹”合并简化成“当”等等。
2)同音兼代:用一个原有的笔画较少的字兼代同音的笔画较多的繁体字,如用“干”兼代“乾、幹”;用“蒙”兼代“懞、矇、濛”等等。詹教授指出同音替代又分“同源字同音替代”和“非同源字同音替代”两类情况。如前述“蒙/懞矇濛”一组就属同源字同音替代;而“几/幾”、“斗/鬥”、“谷/穀”等属于非同源字替代[10]。
50年代进行汉字简化的当时,一是大陆和港、澳、台之间在政治、经济、文化诸领域均处于隔离状态,相互没有交流;二是计算机在中国基本还没有应用,所以不可能出现上文所说的转换错误这种现象,人们也就自然不会考虑到采用合并简化和同音兼代会给21世纪的计算机汉字信息处理带来问题。所以,非对称简繁字问题是历史的局限所造成的。
2.非对称简繁字的数量
一般认为,非对称简繁字的数量有110多组[11]。冯寿忠在《“非对称繁简字”对照表》中列出117组;孙德平在《Microsoft OfficeXP中文简繁转换中非对称性繁简字的使用》中列出116组;但据李牧在他的《两岸汉字字形的比较与分析》一文中统计有247组共260字,其中一简对二繁的235组计235字;一简对三繁的11组计22字;一简对四繁的一组计3字。
3.非对称简繁字的实质
詹鄞鑫教授在《试论“非对称繁简字”》[12]一文中指出:“非对称繁简字中的绝大多数,本质上属于‘异形词’的问题,而不是汉字简化的问题。”并对此作了深入分析:
凡是非对称繁简字,也就是一个简化字对应多个繁体字的现象,它必须借助上下文语境来判断简化字与繁体字的对应关系,也就是说,它涉及的是某一个词是用哪个字来记录的问题。这种关系,就不是纯粹的文字问题,而是选字记词问题。
……
其实,选字记词问题,并不限于单音节词,双音节或多音节词也有类似的问题。例如:芸豆-云豆,扁豆-萹豆,蛤蟆-虾蟆,繁衍-蕃衍,抵触-牴触,叫花子-叫化子,指手划脚-指手画脚,等等。这类现象属于所谓“异形词”问题。
……
“萝卜-蘿蔔”,就两者的关系而言,“蘿”写成“萝”是汉字简化问题,但“蘿蔔”的“蔔”写成“卜”,则不是汉字简化问题,而是记词用字问题。“萝卜”与“蘿蔔”选用“卜”字,与“扁豆”与“萹豆”选用“扁”字,显然属于完全相同的问题,即都是“异形词”规范的问题。非对称繁简字中诸如“老板-老闆”,“别扭-彆扭”,“了解-瞭解”,“下摆-下襬”之类,也都属于相同的问题。
……
汉字简化问题,就是减少单个汉字的书写笔画的问题。它不涉及具体的语境,只要是甲字简化为乙字,那幺,不论在什幺场合下用字,只要采用繁体字,就采用甲字,只要采用简化字,就采用乙字。这样一种处理方式,汉字学习者不需要具备超出简单识字之外的语文知识;更重要的是,在计算机处理的过程中,不必采用任何补充手段,瞬间就可以完成简化字文献与繁体字文献的转换工作。
4.非对称简繁字问题的解决方法
对于非对称简繁字问题的解决方法,主要有以下三种意见:
1)主张以机际交流的需要为出发点,对非对称简繁字进行全面调整,实现简体字和繁体字的一一对应,以实现计算机简、繁汉字文本之间的完全自动转换。
持这种观点的人士主要有上海詹鄞鑫、周胜鸿、江苏冯寿忠、深圳赖国荣和蔡雪雯等。他们认为应该根据不同情况,对非对称简繁字所涉及到的简体字分别作不同调整。
冯寿忠先生在《繁简转换的障碍应当清除——谈对非对称繁简字的调整》一文中论述了调整非对称简繁字的必要性和可能性,指出“我们不能奢望计算机能解决我们的所有问题,而应从根本上解决汉字本身的问题”。并提出了五点建议:一是废除不能对应转换的简繁关系,保留能够对应转换的简繁关系。如“发—髮發、汇—匯彙、赃—髒臓”三组非对称简繁字中,废除“发—發、汇—彙、赃—臓”三组对应关系,保留“发—髮、汇—匯、赃—髒”三组对应关系;二是废除相关字组的简繁关系后,必须与简体字并存的对应繁体字,原样恢复为规范字。如前例中的“发—發、汇—彙、脏—臓”三组简繁字的对应关系取消后,恢复“髮、匯、髒”三个繁体字为规范字;三是繁体字恢复为规范字后,能类推简化的继续进行简化,如“摆—擺襬、当—當噹、尽—盡儘”三组非对称简繁字,按第一点保留“摆—擺、当—當、尽—盡”的对应关系,废除“摆—襬、当—噹、尽—儘”三组对应关系,相应恢复“襬、噹、儘”的规范字地位,然后再将其简化为“
詹鄞鑫教授在《关于简化字整理的几个问题》中指出:“评判汉字改革的过去和放眼汉字整理的未来,都必须以计算机汉字信息处理和交流的效率作为最首要的标准。”并提出:“为了消除繁简汉字转换中的反自动化思想因素,必须彻底消除繁简汉字不一一对应的状态(实现每一个简化字只能对应惟一的繁体字而不需要根据上下文进行人工甄别)”;“非同源字的同音替代和同源字的同音替代,都必须无条件取消。”
在《试论“非对称繁简字”》一文中,詹教授认为应该“把属于‘异形词’性质的非对称繁简字从‘汉字简化’的问题中抽出来,回归为‘异形词’问题,并按照‘异形词‘的模式来处理,那么,就有可能最大限度地减轻非对称繁简字带来的弊病,而保持其原来所期望的利益。”
文章从三个方面提出了对非对称简繁字的处理建议:
有的非对称繁简字,在《汉字简化方案》颁布之前是不通用的,也不具有理据性,甚至连读音也并不相同,就应该恢复其固有的用法。例如“斗争”的“斗”写作“斗”,原是一种只局限在解放区民间局部通行的俗写字。两者字义不同,读音也有别,混同之后将削弱文字记录语言的明确性,如原先“斗牛”和“斗牛”的意义是很明确的,都写成“斗牛”之后,意义就不明确了。这类音近替代的用法应该取消。
有的非对称繁简字,原本有一定的通用性,也谈不上理据问题。例如做副词用的“纔”用同音的“才”替代。作为“异形词”,副词“纔”改用“才”字是合适的。但这只是作为副词“纔/才”的记词定字规定,汉字中的“纔”字照样存在,除了大型字典的字头之外,在翻印或抄写古籍时还是保留原来的写法。引用文献时改动原字的做法是违背文献引用原则的。
有的非对称繁简字,从字源的角度说是有理据的,例如:云-云,迴 -回,捨-舍,採-采,鬍鬚-胡须,等等。但它们的用法早已形成分工,其对应本质上属于“古今字”的关系,字形分化正是为着缓解汉字记词的负担,加强记录语言的明确性。例如“捨弃”的“捨”,上古文献本写作“舍”,意思是搁置,引申表示舍弃,在这个意义上加类化符号“扌”而写作“捨”。这正是为着减轻“舍”字的记词负担。‘“捨-舍”的分工已沿用两千多年,留下了无数的历史文献。从今天的用字环境来说,‘“捨”写作“舍‘在一般场合下大概是没有歧义的,但这一合并,就会造成简化字文献和繁体字文献的计算机转换处理的难度。在现代化的社会中,可以说,任何妨碍信息处理自动化的方案,一定不是科学合理的。正是出于这样的考虑,我认为这类合并宜取消,恢复它们原来的分工状态。
上海汉字研究史料馆周胜鸿先生在《非对称繁简字规范化整理的学术探讨》一文中,提出了对110多组非对称简繁字进行规范化整理的建议,并且提出了“应当调整若干组非对称繁简字”的意见。具体有以下几项:
一是在使用时不易发生混乱并早已约定俗成的,可以予以保留,如“别(彆)、才(纔)、体(體)、万(萬)”等4组;
二是在使用时会发生混乱的,必须下决心调整,一般来说,均要恢复原来被兼代而简化的繁体字,如“斗(鬥)、干(乾,幹)、了(瞭)、面(麵)”等约100组;
三是某些被同音字替代的字,可以通过偏旁类推简化的方法简化其偏旁。如:“餘-
四是在使用时会发生混乱,但如果恢复原来被兼代而简化的繁体字,恢复的繁体字笔划又确实过于繁多,对这一类字,建议另造新简化字予以替代。这一类“非对称繁简字”不多,只有5组。具体建议“签-籖”组恢复“籖”再简化为“
深圳大学2004届毕业生,文学学士赖国荣和蔡雪雯的观点与周胜鸿先生的接近。他们在合写的《试论简繁字之调整》一文中,提出了类推简化后恢复使用、直接恢复使用以及恢复部分原被淘汰的异体字等三项建议,同时列出了具体字例。
2)主张以人际交流的需要为出发点,只需恢复少数繁体字。
持这一观点的主要有项菊和汪化云两位先生。
项菊先生明确主张在非对称简繁字的整理中,应“以人与人交际的需要作为主要出发点”。他认为在自己统计得出的117组非对称简繁字中,使用频率低的30字和同音合并的42个非对称简繁字可以不予整理;余下的45字,再排除以下五类字:第一类是,异音归并字中原有音义极其罕用,归入另一音义后在使用中不致发生冲突的字;第二类是,和一个简体字对应的两个异音繁体字,而两个异音繁体字中又有一个已产生了字形分化,不影响交际的字;第三类是,使用范围极其狭窄的字;第四类是,有一音位置固定,不会引起交际混乱的多音简化字;第五类是,简化前存在异体,现作为规范字使用的简化字所对应的繁体字。这五类字共计有29个。最后余下需要恢复使用的繁体字仅为16个[13]。
汪化云先生把他统计出的117组非对称简繁字分为“多音简化字”和“单音简化字”两类,认为“多音简化字要适当地按音分化”,但需要考虑恢复的繁体字只有30个;另外需要“恢复部分同音归并的繁体字”,但只有4字;合计需要恢复的繁体字只有34字[14]。
3)通过计算机软件的智能处理来实现计算机简繁汉字文本之间的完全自动转换,而不必修改大陆现行的汉字规范。
项菊先生认为:“只要语言文字专家和软件设计专家通力合作,117组非对称简繁字的转换想必不是一个太麻烦的问题,只是这种转换在市场上并没有成为广泛的和迫切的需要,才使得这一研究没有大规模展开因而没有令人鼓舞的成果罢了。所以我们认为,计算机中简繁字转换完全能够‘头疼医头,脚疼医脚’,并且这也是从根本上解决问题”[15]。
孙德平先生在《Microsoft Office XP中文简繁转换中非对称性繁简字的使用》一文中,在比较了三种解决方案之后,认为以通过软件解决的方案为好。他期待“语言文字方面的专家和计算机软件设计方面的专家能通力合作,既从文字方面又从软件设计方面把‘Microsoft Office XP中文简繁转换’中的障碍清除,使大陆与港澳台之间,甚至与全球其他地区的华人社区之间的汉语信息交流畅通无阻。”
沈克成先生在《汉字简繁转换方法新探》一文中,提出了自己的计算机简繁转换软件的设计思路。沈先生认为,依照这个思路设计的软件,可以使计算机简繁汉字转换的准确率达到99%以上。
台湾戚桐欣先生也设计了相关软件,他认为自己的软件完全可以保证在简繁并存的情况下,顺利输入和输出各体汉字[16]。
但是也有学者对此持不同观点。冯寿忠教授在《繁简转换的障碍应当清除》、《关于统一两岸四地汉字字形的几种设想》等文中指出:计算机软件是“不能从根本上解决问题”的。他说:
大家都把注意力投向了软件方面,企图通过软件的不断改进,彻底消灭简繁转换的文本错误。最常见的办法是采用词语转换。这种做法理论上就存在先天不足,因为,词语是语言系统中最活跃的因素,吐故纳新的频率比较快,任何词典都不能穷尽所有的新生词语,而计算机软件则不能随时改进;如果解决了文字的一一对应问题,就可以一劳永逸,因为任何词语都是用单字组成的。
陈明然也在《论信息时代的汉文字改革》[17]一文中指出:“汉民族社会的语言是极其丰富的,是任何语料库都无法穷尽的;再次,随着社会的发展和人们生活内容的变化,大量新语汇不断涌现,而需要投入巨大的人力物力来制作的语料库却不可能时时更新”。
沈克成、沈迦父子也曾于早些年在《汉字简化说略》[18]一书中提出:“必要时应恢复部分被借代的繁体字”,并对若干非对称简繁字的调整提出了具体建议。他们说:如果“适当允许将部分被归并的异体字恢复使用,适当允许将少量被简化的繁体字恢复原状,我们就可以避免错误丛生,笑话百出,我们就可以消除繁简或正异错位的讹误,从而通过计算机的一键切换,把任何文章准确无误地转换成繁体。”[19]
5.王敏東的《不对称汉字在台湾接受度之调查》[20]
2005年5、6月间,台湾铭传大学副教授王敏東博士在台北进行了当地社会对非对称简繁字接受度的调查,并於当年7月25日在于成都举行的第八次汉字书同文学术研讨会上宣读了论文《不对称汉字在台湾接受度之调查》(以下简称《调查》)。
《调查》中提到:冯寿忠、周胜鸿、林維盛、馮翰文、李永明、孙德平等在相关文章或发言中对非对称简繁字“均曾提出讨论,先后统整举出约110组的所谓不对称汉字,并提出不对称汉字是否应纳入目前大陆使用字体中的意见。而若推行此意见方案,可能需让台湾接受部分的简化字或异体字。但文献中并未讨论这些不对称汉字在台湾施行时接纳的可行性及可能碰到的阻力。”并说明:“本研究主要依据先行研究所提出的111组不对称汉字在台湾进行接受度问卷调查,以了解目前这些字组在台湾被接受的情形,并进而分析其被接受与否的原因。”
调查问卷根据周胜鸿提出的111组非对称简繁字设计。接受调查的共计185人,回收有效答卷180份;答卷人士中男性49人,女性131人。受调查人士的年龄分布情况为:18岁以下60人;20岁至30岁97人;31岁至40岁8人;41岁至60岁12人;60岁以上1人。学历分布情况为:国小3人;高中及高职63人;大专89人;硕士21人;博士3人;不明1人。职业分布情况为:学生136人;家庭主妇2人;军人5人;公务员1人;教师16人;工人1人;商业人士3人;服务业7人;自由职业5人;其他1人;不明者3人。
经王统计,无人勾选的有13字,具体为:“(表/錶)叔”组中的“錶”;“(沖/衝)洗”组中的“衝”;“.煙(斗/鬥)”组中的“鬥”、“(ㄦ/兒)童”组中的“ㄦ”、“稻(谷/穀)”组中的“谷”;“皇(后/後)”组中的“後”;“(胡/鬍)鬧”组中的“鬍”;“(胜/勝)利”组中的“胜”;“(苹/蘋)果” 组中的“苹”;“(愿/願)望”组中的“愿”;“(丰/豐)富”组中的“丰”;“(蒙/矇/濛/懞)古”组中的“懞”;“抽(签/簽/籖)”组中的“签”,另外“(蒙/矇/濛/懞)古”组中的“矇”只有8人勾选,“濛”只有1人勾选;“抽(签/簽/籖)”组中的“簽”只有35人勾选。
对于“丑/醜、ㄦ/兒、范/範、坏/壞、帘/簾、价/價、蜡/蠟、沈/瀋、么/麼、苹/蘋、余/餘、适/適、体/體、涂/塗、筑/築、准/準、愿/願、广/廣、虫/蟲、丰/豐、党/黨、沄/澐、宁/寧、万/萬、与/與”等字组,答卷者均较多勾选其中右侧的繁体字,另外对于“当/當/噹”组,选“當”的居多;选“噹”的最少;选“当”的居中,对于“汇/匯/彙”组,选“匯”的居多;选“汇”的最少;选“彙”的居中。
对于以下字组中同组的字,多数台湾人认为不宜混淆,应作为独立的字在不同场合区别使用:“表/錶、厂/廠、沖/衝、出/齣、担/擔、淀/澱、冬/鼕、斗/鬥、伙/夥、干/乾/幹、回/迴、谷/穀、刮/颳、櫃/匱/柜、合/閤、后/後、胡/鬍、划/劃、获/獲/穫、家/傢、蒙/矇/濛/懞、借/藉、据/據、咸/鹹、困/睏、累/纍、里/裏、曲/麯、舍/捨、胜/勝、霉/黴、姜/薑、面/麵、篾/衊、辟/闢、仆/僕、朴/樸、千/韆、纤/縴/纖、签/簽/籖、秋/鞦、卷/捲、向/嚮、郁/鬱、术/術、松/鬆、台/臺/檯/颱、坛/壇/罎、吁/籲、系/繋/係、钟/鐘/鍾、致/緻、只/隻/衹、朱/硃、准/準、御/禦、须/須/鬚、团/團/糰、佣/傭、脏/臟/髒、弥/彌/瀰、漓/灕、几/幾、尽/儘/盡、摆/擺/襬、制/製、恶/惡/噁、发/發/髮、历/歷/曆、卤/鹵/滷、征/徵、云/雲、折/摺、症/癥”。
答卷者偏向勾选的笔划较简的字只有“才/纔”和“克/剋”两组中的“才”和“克”。
最后,王博士得出“问卷结果趋势”是:“台湾人对于这111组繁简字认为须繁/简划分开来的意识很强”。
6.周胜鸿就非对称简繁字问题致《规范汉字表》课题组、专家评审组的信
2007年1月23日,上海汉字研究史料馆周胜鸿先生就非对称简繁字问题给国家语言文字工作委员会《规范汉字表》课题组和专家评审组写了题为《全面调整“非对称繁简字”是修订好〈规范汉字表〉的核心问题》的信。
信中写道:“如果有关部门未能抓住这次时机把简化字问题来一个比较完美的合理的解决,从而一步到位地解决几十年来用字混乱和海内海外书不同文的状态,那将给我们及后人继续留下无尽的烦恼和诟病,也不能解决汉语汉字顺利进入互联网、并在互联网上占有应有的地位的问题。”
周胜鸿先生在信中重申了河北戴金旺先生、华东师范大学詹鄞鑫教授、江苏技术师范学院冯寿忠教授及他本人在相关刊物或学术会议上就非对称简繁字问题发表的各项意见,并随信附上了台湾铭传大学副教授王敏東博士的《不对称汉字在台湾接受度之调查》和加拿大华人学者李牧先生的《非对称繁简字的解决拟案》。
[1]“非对称简繁字”是本书的提法;“非对称繁简字”是周胜鸿、冯寿忠等人士的提法;“不对称汉字”是王敏東博士的提法。
[2] 以上四文均见于沈克成主编《汉字书同文研究》第1辑,气象出版社2001年9月第1版。
[3] 见香港《语文建设通讯》总第82期。
[4] 见冯寿忠主编《汉字书同文研究》第3辑,香港华夏文化出版有限公司2002年8月第1版。
[5] 在“简化字问题学术研讨会”上提交的论文,载史定国主编《简化字研究》,商务印书馆2004年9月版。
[6] 载周胜鸿、陈明然主编《汉字书同文研究》第6辑,香港鹭达文化出版公司2005年5月第1版。
[7] 见蔡新中、何华珍主编《汉字书同文研究》第5辑,香港文化教育出版社2004年6月第1版。
[8] 三文均载《汉字书同文研究》第6辑。
[9] 载李禄兴主编《汉字书同文研究》第4辑,香港鹭达文化出版公司2003年7月第1版;或史定国主编《汉字规范问题研究丛书》《简化字研究》分册,商务印书馆2004年9月版。
[10 ] 詹鄞鑫《关于简化字整理的几个问题》。
[11 ] 见周胜鸿《非对称繁简字是信息时代汉字走向互联网的瓶颈》。
[12] 载香港《语文建设通讯》总第82期。
[13] 见项菊《非对称繁简字整理刍议》。
[14] 见汪化云《非对称繁简字整理问题初探》。
[15] 同注[13]。
[16] 参阅冯寿忠《关于统一两岸四地汉字字形的几种设想》,载周胜鸿、陈明然主编《汉字书同文研究》第6辑,香港鹭达文化出版公司2005年5月第1版。
[17] 第七次汉字书同文学术研讨会论文,载《语言文字网》(www.yywzw.com/cmr)。
[18] 人民日报出版社2001年1月版,225页。
[19] 同注[18],259页。
[20] 全文将刊于稍后出版的《汉字书同文研究》第7辑。