三、讨 论
我们要研究简化字和繁体字的对应问题:首先就要明确“简化字”和“繁体字”这两个概念。本文认为,不能把“简化字”等同于大陆通用汉字系统;也不能把“繁体字”等同于台湾、港澳的通用汉字系统。简化字和繁体字的对应关系,也不等同于大陆用字和港澳台用字在字形上的对比。“简化字”和“繁体字”这对范畴,是随着国务院1956年发布《汉字简化方案》[[1]]而出现的;因而也就自然地和《总表》紧密地联系在一起。没有《总表》,也就不存在“简化字”和“繁体字”了。
笔者曾经在《汉字书同文研究若干术语之管见》[[2]]一文中写道;
“简体(化)字”,应是指中华人民共和国国务院于1956年公布,中国文字改革委员会、文化部、教育部1964年3月7日联合颁布的《关于简化字的联合通知》中所规定,并由国家语言文字工作委员会于1986年10月10日重新发表的《简化字总表》中的2235个汉字。“繁体字”,应是指《简化字总表》中2235个简体(化)字所对应的简化以前的字形。
我国大陆当代的通用汉字数量,按照国家语言文字工作委员会和中华人民共和国新闻出版署于1988年3月25日联合发布的《现代汉语通用字表》,是7000个字。这就是说,我国大陆目前的通用汉字中,有4765字并不属于简化字之列;如果按汉字总数来算,就更是有数以万计的字不在简化字之列。由此可知,笼统地用“简体(化)字”来称谓大陆目前的通用汉字,是不准确的。
既然“简化字”和“繁体字”这两个术语只用于严格地指称《总表》里的汉字,那么,用什么术语指称《总表》以外的汉字呢?傅永和先生用“传承字”[3];余仁先生提出用“传统字”[4];詹鄞鑫先生提出用“沿用字”[5]。这三个术语应该说都比较贴切,但相比而言,本文认为“沿用字”这一提法更为准确一些。
“传承”,《汉典网》和《在线新华字典》的解释是“更替继承”,也就是说,在传承过程中是有更替的。根据这个解释,我们也可以说简化字是繁体字的传承字,所以,“传承字”这个称谓还不足以明确地把《总表》以外的其他汉字同简化字、繁体字加以区分。
“传统”,《现代汉语词典》的解释是“世代相传、具有特点的社会因素,如风俗、道德、思想、作风、艺术、制度等。”简化字、繁体字以外的这部分汉字固然是世代相传使用的文字,然而简化字和繁体字同样也是世代相传使用的文字,所以,“传统字”这个称谓也不足以明确地把《总表》以外的其他汉字同简化字、繁体字加以区分。
“沿用”,《现代汉语词典》和《汉典网》的解释都是“继续使用(过去的方法、制度、法令等)”,也就是说,“沿用”是不加改变地使用过去的某种事物。在我们所讨论的简化字、繁体字以及简化字、繁体字以外的其他汉字这样三部分汉字中,简化字是对原繁体字的改变更替;繁体字则在被简化以后不再作为中国大陆的规范汉字使用;而简化字、繁体字以外的其他汉字,则是《总表》发布以后继续使用的过去的文字。可见,这里用“沿用”最为准确。
简化字和沿用字,都是中国大陆目前的规范汉字[[6]]。
台湾从来未曾进行过汉字的简化,也没有发表过任何简化字表,对于大陆的《总表》也采取不认可态度;因此,严格地讲,在台湾岛范围内,不存在“简化字” 和“繁体字”;故而才有马英九先生的“正体字”之说。由于习惯上的关系,我们这里仍然把台湾通用汉字中,字形和大陆《总表》中繁体字字形相同的字看作繁体字(不妨称其为客观繁体字),即使这样,由于:
台湾有关当局于1998年公布的《國字標準字體宋體母稿》中,有常用字4808个,次常用字6341个,合计为11149个。这11149个字中,减去由《简化字总表》简化的2258个繁体字[[7]],余下的8891字并不在“繁体字”之列;如果按汉字总数来算,就更是有数以万计的字不在繁体字之列。由此也可知,把台湾目前通用的所有汉字都称之为“繁体字”,也是不准确的。
如果大家能够同意上述观点,那么在把《总表》作为非一一对应简繁字研究的主要依据这个问题上,应该可以达成共识了。
那么,本文为什么又要主张把《一异表》作为研究的依据之一呢?这是因为,在两岸四地通用汉字系统的对应关系上,除了非一一对应简繁字,还有一个问题就是存在非等同异体字[[8]]。二者分属于不同的范畴,在社会应用上有着不同的表现,解决问题的途径也将不同。异体字是音同义同的两个或者多个字;非一一对应简繁字中一个简化字对应的是音、义不同或不尽相同的两个或者多个字。异体字的代替使用不会引起歧义;而简繁转换错误会引起歧义。解决非等同异体字问题需要两岸四地的共同协商;而非一一对应简繁字问题只需大陆一方就可以解决。因此,本文主张不要在非一一对应简繁字的研究中混淆这两个不同的汉字集合,应该依据《一异表》,把不属于简繁关系的非等同异体字剥离出来。
第二个问题,在对两岸通用汉字系统的称谓问题上,既然不宜用“简体字”和“繁体字”笼统称之,那么用哪一对术语为好呢?笔者曾在《汉字书同文研究若干术语之管见》[[9]]一文中主张采用李牧先生的提法:
李[[10]]先生用“大陆规范字”指称大陆用字,在某些场合简略为“陆规字”;用“台湾标准字”指称台湾用字,在某些场合简略为“台标字”。本文主张在指称大陆和台湾两地目前的通用汉字系统时,以使用这一对称谓为好。
首先,用“规范字”指称大陆用字,有法律依据。《中华人民共和国国家通用语言文字法》第二条规定:“本法所称的国家通用语言文字是普通话和规范汉字。”第三条规定:“国家推广普通话,推行规范汉字。”由此可见,把大陆通用汉字称为“大陆规范字”,是符合《中华人民共和国国家通用语言文字法》的。
其次,用“规范字”和“标准字”这一对称谓,也分别符合两岸民众对各自通行汉字系统的指称习惯。第一,“规范字”这一称谓符合大陆民众对自己使用的通用汉字的指称习惯。多年来,众多的大陆学者,在就当代汉字问题著书撰文时,均频繁地使用着这个称谓。第二,使用“标准汉字”这一称谓符合台湾民众对自己使用的通用汉字的指称习惯。台湾有关当局发布的各种字表名称,就分别是《國字標準字體宋體母稿》、《國字標準字體楷書母稿》、《常用國字標準字體筆順手冊》等等。
其三、“大陆规范字”、“台湾标准字”这对称谓,基本不带感情色彩,较易被两岸民众接受。从词义上看,“规范”一词,《现代汉语词典》的解释是“约定俗成或明文规定的标准”;即,“规范”和“标准”在词义上是相通的。
第三个问题,就是要不要把各种字词典里超出《总表》范围的类推简化字也作为样本?也就是要不要无限类推?本文的观点是否定的。
李国英教授在《简论类推简化》一文中有一段话,很能够说明这个问题:
有的字词典把类推简化的范围严格限制在《总表》的范围之内。如《汉语大字典》,它的《凡例》中明确规定“简化字以中国文字改革委员会编的《简化字总表》所列字目为准”,没有收录超出《总表》的类推简化字。有的字词典类推简化超出了《总表》的范围,但范围并不统一。《现代汉语词典》对收录简化字的标准未作具体说明,但客观上收了部分超出《总表》的类推简化字。……。《辞海》明确规定:“偏旁类推简化字的范围,以《简化字总表》中的一百三十二个‘可作简化偏旁用的简化字’和十四个‘简化偏旁’为准”,明确了类推简化的原则,收录的类推简化字也大大超过《现代汉语词典》的范围。……。目前收录简化字最多的是《中华字海》,该书在“凡例”介绍收字范围时指出,该字典所收的简化字包括:“当今出版物中出现的超出《简化字总表》范围之外的类推简化字。”[[11]]
各种字词典,是我们研究工作中必不可少的工具,主要用于查检字音、字义;但因为收字规则不统一而不能作为研究的依据。各种字词典中的类推简化字反映的是各编著者个人的观点,而不是国家的权威规范,尽管有些字词典冠上了“规范”之名。我们如果把字词典作为研究的依据,就会使研究工作陷入无所适从的境地,也会把某些本来并不是《总表》的缺陷算到《总表》头上,这对《总表》也是不公平的。非一一对应简繁字字组数的众说纷纭,其中一个重要的原因,也就在于此。例如有些研究者把“坝垻壩”、“沄澐”列为不一一对应简繁字。实际上“垻”和“沄、澐”都不是《总表》中的字。
2002年6月,在教育部语言文字管理信息司、语言文字应用研究所和安徽大学联合举办的“简化字问题学术研讨会”上,就类推简化的问题已经达成共识,不赞成无限类推。王宁教授指出:“近十年来,类推已经在无限扩大,对汉字产生了极大的扰乱作用,不限部位、不限层次、不限功能的无限类推,在汉字本来数量繁多的情况下,又人为地造出大量历史上从来没有使用过的‘人造汉字’,给使用领域带来更大的不便”[[12]]
第四个问题,各种供信息处理用的(汉字)字符集如GBK[[13]]、GB13000[[14]]、GB18030[[15]],以及台湾的CNS11643[[16]]、BIG5[[17]]和国际上的ISO 10646/Unicode[[18]]等,能不能作为研究非一一对应简繁字的依据?
本文认为:汉字信息处理方面的相关字符集,是有关计算机中文软件的行业标准,属于“计算机信息处理技术”的范畴。它不是国家语言文字管理部门或者台湾地区相关部门颁布的汉字使用规范,不能作为研究非一一对应简繁字的依据。
为了满足计算机汉字信息处理的需要,GBK、GB13000、GB18030中都收入了大量的繁体字,以及日本和韩国使用的汉字,很显然,这些字符集不是国家的汉字使用规范。另外,连同ISO 10646/Unicode在内,这些字符集中还有一些《总表》外的类推简化字。台湾的CNS11643中收录了ISO 10646中的汉字,也就是说,CNS10646中包含了大陆的简化字,显然也不是台湾的汉字使用规范;BIG5与台湾国语推行委员会颁布的《国字标准字体楷书母稿》等台湾地区用字规范也不尽相同。如果把这些字符集也作为研究的依据,就会产生混乱。
第五,相关术语问题。以往几年,多数人习惯称“非对称繁简字”[[19]];冯霞女士称其为“繁简字字形不一一对应”[[20]];苏培成教授称为“借用简化字”[[21]];连登岗教授称其为“归并字”、“代替字”[[22]];杨蓉蓉女士称“简繁体一对二(及二以上)”[[23]];李牧先生称“简一繁多”[[24]];王敏東博士称“不对称汉字”[[25]]。笔者在《民间汉字书同文研究十周年纪念文集》中,用了“非对称简繁字”这个称谓;在《汉字书同文研究若干术语之管见》一文中,又建议用《语文建设通讯》编辑部长期以来使用的“非一一对应”这个提法[[26]],综合起来就是“非一一对应简繁字”。这里再把具体理由阐述如下:
首先是“繁”、“简”二字的顺序。由“繁简”改成“简繁”,是因为这一类字组中,除了8组一对多繁简字[[27]],其余的都是一对多简繁字字组;就是8组一对多繁简字,也同时兼有一对多简繁字的属性[[28]]。在计算机汉字文本的繁/简、简/繁转换过程中,转换错误一般都发生在由简转繁的情况下。还有一点考虑就是,不少人习惯把这些字组称作“一对多”而不称“多对一”。“一对多”中的“一”在前,是指简化字;“多”在后,是指繁体字。由此可见,把“简”字放在前面较为合适。
其次是“对称”和“对应”。《现代汉语词典》对“对称”的解释是“指图形或物体对某个点、直线或平面而言,在大小、形状和排列上具有一一对应关系。”[[29]]《辞海》从多学科的角度就“对称”一词给出了解释,总的来看,“对称”这个词描述的主要还是事物在形状、性质方面所表现出来的特点,而不是数量方面的特点。如果把它用来描述汉字,我们可以说“非”字是左右对称的;“口”字是上下、左右都对称的等等。如果用来描述简化字和繁体字的对应关系,例如说“‘帅’和‘帥’相对称”;不如说“‘帅’和‘帥’相对应”比较贴切。《现代汉语词典》对“对应”的解释是“一个系统中某一项在性质、作用、位置或数量上跟另一系统中某一项相同”[[30]],可见这里用“对应”要比用“对称”贴切。
“繁简”改成“简繁”,“对称”改成“对应”以后,习惯上所用的“非对称繁简字”就成了“非对应简繁字”,这就又出来一个问题:“非对应简繁字”中的“非对应”,究竟是指某个简化字和某个繁体字之间不存在对应关系呢?还是指某一个简化字对应于两个或者两个以上的繁体字呢?例如我们也可以说“‘应’字和‘該’字是‘非对应简繁字”;为此,再用“非一一”对“对应”一词加以限制,就得到“非一一对应简繁字”这个完整的术语。
“非一一对应简繁字”中的“简繁”,说明指的是简化字和繁体字之间的对应关系;“对应”说明所指的简化字和繁体字,是相互对应的;“非一一”则说明了这些相互对应的简化字和繁体字在数量上不是一对一的。
其它的几种提法,本文建议以不用为好。如“借用简化字”、“归并字”、“代替字”这三种提法,只是说明了这些字的简化方法,没有完全体现这些简化字和原繁体字形之间的对应关系;“简繁体一对二(及二以上)的”、“简一繁多”等提法,只是简单的把对应的双方划分成简化字和繁体字,实际上,这里的“一对二”里的“二”以及“简一繁多”里的“多”,并不都是繁体字。除了冯寿忠教授划入统一简化类[[31]]的22组,所谓的“一简对多繁”的“多繁”中,至少有一个是带有简化字属性的字。例如“板—板闆”一组字,左边的“板”只能作“闆”的简化字来看,不能看成是“木板”的“板”,因为在1956年汉字简化以前,“木板”的“板”就是这么写的;右边“板闆”两字中的“板”,应该作为简化前的字,也就是“木板”的“板” 来看。它不是繁体字,也不是简化字,不过由于它的字形和“闆”的简化字“板”相同,我们可以称其为“客观简化字”,但是却绝对不能称其为繁体字。因此,“板—板闆”这组字里,左、右两边是一种“简-简繁”对应关系。本文建议的“非一一对应简繁字”这个术语中的“简繁字”,既可以表示相对应的双方是简化字和繁体字,又可以表示对应双方中的一方是简化字,另一方是一个客观简化字和一个或者多于一个的繁体字。这样就比较准确了。
“一简对多繁”和“一繁对多简”这两个术语,缺点也在于把相对应的双方、简单地看成是清一色的简化字或者清一色的繁体字。本文建议改用“一对多简繁字”和“一对多繁简字”。前者用于一个简化字对应多个繁简字的情况;后者用于一个繁体字对应多个简繁字的情况[[32]]。具体理由和前面所讲的相同,不再重复。
[1] 1964年3月7日,中国文字改革委员会、中华人民共和国文化部、中华人民共和国教育部发布《关于简化字的联合通知》中改称《汉字简化总表》;1986年10月10日国家语言文字工作委员会重新发表《简化字总表》。
[2] 载《语文建设通讯》第89期,31页。
[3] 傅永和《汉字七题》,河南教育出版社,1993年3月第1版。
[4] 余仁《关于繁/简字的认定》,载《语文建设通讯》第89期,37页。
[5] 詹鄞鑫《关于简化字的一些思考》,载《语文建设通讯》第91期,第1页。
[6] 傅永和:“规范汉字包括经过整理简化的字和未整理简化的传承字。”《汉字七题》。周有光:“规范汉字,包括简化字和传承字”,教育部著名语言学家及有关人士与记者座谈会,2006年3月22日。
[7] 《简化字总表》列出的2235个简化字的简化前字形(繁体字)为2258个。
[8] 关于“非等同异体字”,请阅冯寿忠主编《汉字书同文研究》第三辑中冯寿忠、李桐贤的系列文章,香港华夏文化出版有限公司2002年8月第一版。
[9] 同注25。
[10] “李先生”即李牧先生。“大陆规范字”和“台湾标准字”这对称谓始见于李先生的《两岸汉字字形的比较与分析》一文,详请参阅注18。
[11] 李国英《简论类推简化》,载史定国主编《简化字研究》,99页,商务印书馆2004年9月第1版。
[12] 陈双新《简化字问题学术研讨会纪要》,载史定国主编《简化字研究》,378页,商务印书馆2004年版。
[13] GBK的全称是《汉字内码扩展规范》,由中华人民共和国中华人民共和国信息技术标准化技术委员会于1995年12月1日制订。GBK收录了ISO 10646.1中的全部CJK汉字和符号(C-中国、J-日本、K-韩国),并有所补充。
[14] GB13000的全称是《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》,由中华人民共和国信息产业部提出,它等同于国际标准ISO/IEC 10646.1:1993《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》,即也收入了全部CJK汉字。
[15] GB18030的全称是《信息交换用汉字编码字符集基本集的扩充》,由信息产业部和原国家质量技术监督局于2000年3月17日联合发布,在字汇上支持GB 13000.1的全部中、日、韩(CJK)统一汉字字符和全部CJK扩充A的字符,并且确定了编码体系和27484个汉字。
[16] CNS11643的全称是“中文標準交換碼(Chinese Standard Interchange Code)”,最早由台湾标准局于1975年8月颁布,并于1981年5月扩编后重新颁布,其中第4字面包括ISO 10646第2版中的汉字集。
[17] BIG5码是通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”,1984年由财团法人资讯工业策进会和宏碁、神通、佳佳、零壹、大众五家公司共同创立,故称五大码。该编码标准共收录13,060个汉字。
[18] ISO10646的全称是《通用多八位编码字符集》,由国际标准化组织于1993年颁布。它是一个包含世界上各种语言的书面形式以及附加符号的编码体系,其中的汉字部分为“CJK统一汉字”,而CJK中的中国部分则包括了中国大陆规范汉字及台湾CNS11643标准中的第1、2字面。
Unicode又名“统一代码”。Unicode集团是由美国的HP、Microsoft、IBM、Apple等几家知名的大型计算机企业所组成的联盟集团,成立该集团的宗旨就是要推进世界各国文字的统一编码,故称Unicode。就内容而言,Unicode和ISO/IEC 10646是一致的。
[19] 注2、注3、注13。
[20] 同注9。
[21] 同注4。
[22] 同注6。
[23] 同注7。
[24] 同注8。
[25] 王敏東《不对称汉字在台湾接受度之调查》,载周胜鸿主编《汉字书同文研究》第七辑,34页,香港鹭达文化出版公司2008年1月第1版。
[26] 见陈明然《汉字书同文研究若干术语之管见》,《语文建设通讯》第89期,35页。
[27] 一对多繁简字的字组数,冯霞女士认为是14组;胡百华先生认为是12组。分别见于冯霞《繁简字字形转换中模糊消解的非统计方法》(《语文建设通讯》第87期,40页,香港中国语文学会2007年9月出版发行)和胡百华《“一繁对多简”到底有几组?》(《语文建设通讯》第90期,33页,香港中国语文学会2008年9月出版发行)。
[28] 请参阅陈明然《一个繁体字对应多个简繁字字组数细探》,载《语文建设通讯》第90期,30页。
[29] 中国社会科学院语言研究所词典编辑室编《现代汉语词典》,274页,商务印书馆1983年1月第2版。
[30] 同注41,278页。
[31] 冯寿忠教授在《非对称繁简字对照表》中把非――对称简繁字分为三类,即同音兼并类、非同音兼并类和统一简化类。
[32] 笔者在《汉字书同文研究若干术语之管见》一文中,曾主张分别用“一个简化字对应多个简繁字”和“一个繁体字对应多个繁简字”这对术语。现在看来,这对术语虽然在意思的表达上是准确的,但不够简明。