重视科学性,依照汉字的内在规律进行规范,是符合汉字发展长远利益的;但是,汉字的内在规律又是在多数人的使用中才能显现的,汉字是一种社会运用的符号,它的人文性决定了完全符合数理逻辑的理想汉字实际上并不存在。在广大的使用领域,在计算机高超的贮存技术面前,理论有时显得非常“低能”——这“低能”有些是因为理论缺乏实践的考验,还不够完善;还有一些是因为应用领域瞬息万变的形势,是滞后的理论研究无法反映的。在这种情况下,科学性与社会性一致的地方,应当大胆处理;科学性与社会性产生矛盾的地方,从应用出发应当比从理论出发更具有现实性;面对大众和专业领域,分开层次解决问题更能切合需要。
这里分别举例说明协调科学性与社会性的必要。
(1)规范汉字表的适用范围问题:
中国从20世纪初期结束了言文脱节的时代,在教育领域和文学领域推行白话文。简化汉字是白话文推行后的第一次汉字规范,很显然,他是为书写现代汉语文本而进行的规范,他的适应范围只能是记录现代汉语的使用领域,如果再扩大一点,对普及领域浅显的文言文也大致适用。但是,从1979年开始,中国进入了改革开放的新时代,我们要发挥传统文化的优势,增强民族凝聚力,文言文阅读成为一种新的关注,用简化汉字去书写文言文,以下这些简繁对应的字,足以引起表达上的混乱:
发—髪 征—徵 丑—醜 斗—鬬 范—範
后—後 了—瞭 沈—瀋 松—鬆 叶—葉
几—幾 犹—猶 干—幹 干—亁 ……
解决这个问题,需要首先明确,文言与白话是不同时代的汉语,由于他们构成词汇的要素虽然有着大量的相互包容,但词汇系统已经发生了较大的变化。两千多年的文言受经书的影响,在书写用字上又有了一些既成事实的规则,与现代汉语不可能完全相同。还有一个基本事实也是需要注意的,那就是现代人阅读文言文的人会越来越多,阅读能力也会不断加强,但绝大多数人不会再用文言文来写文章,不会再用文言文来表达现代思想;所以,文言文在很大程度上只是属于专业领域的问题。生硬的把现代汉语与古代汉语拉在一起,让历史语言与现行语言用同一套汉字来书写,只会互相牵扯,使现代汉语的用字因为照顾文言而生出很多枝节,或使古籍用字迁就现代规范产生整理、印刷上的诸多难题。所以,只要明确规定新的规范汉字表的适用范围主要是书写现代汉语文本,但不限制普及领域浅显的文言文使用,专业领域的古籍用字仍可采用原形原字,上述简化字带来的问题就可以消除。这样,在普及层面上,不会因为大量恢复繁体字造成过多的不便,而在古籍整理、印刷等专业层面上,也可以不因为字形归并产生表述上的诸多矛盾,这是各个领域都可以接受的。
(2)异体字问题:
与简化字同时,为了减少字数,1955年12月22日,由文化部和文改会联合发布了《第一批异体字整理表》。整理异体字,提出“正字”的概念,这是中国历史上很多统一和繁荣时期文化建设的好经验。例如,唐代的正字字书《干禄字书》、《五经文字》对一些纷繁的用字划分了正字、俗字、通字,并明确了这三种字适用的文本范围。将职能完全相同的重复汉字认同后,留下一个作规范字,其余不在正式场合使用,这对社会用字特别是基础教学和成人普及教育都是有利的。问题在于,《第一批异体字整理表》所谓的异体字概念是不严格的:
1.意义上有包含关系的。它们不是异体字关系,而是源字与分化字的关系。如:
“背—揹”、“布—佈”、“欲—慾”等
2.意义上有交叉关系的。它们不是异体字关系,而是同源字分化后又通用的同源通用字关系。如:
“玩—翫”、“游—逰”、“志—誌”等
3.仅在一部分义项上有通用关系的。它们不是异体字关系,而是个别义项通用的通假字关系,一般在词的异写时表现为局部的同一用途。如:
“雕—鵰”、“哄—閧”、“斤—觔”等
4.声音相同意义毫无关联的。它们不是异体字关系,而是通假字中典型的同音借用字关系。如:
“昆—崑、崐”、“侖(仑)—崘、崙”、“修—脩”等
这些不严格的所谓“异体字”,一旦进入了正字法的范畴,有一个就要被取消,但是在实际上他们记录语言的职能并没有完全被保留下来的字取代,取消了他们,势必影响表达的准确,造成使用上的很多不便。如果再加上简化字中的同音替代字,表达中的歧义现象更为增多,简繁对应中的一对多和交叉对应的现象也相应增多,带给计算机简繁转换的麻烦当然也就更多了。
数十年来,王力、裘锡圭等文字学专家都提出了“严格异体字”的定义,明确了异体字“必须音义全同,任何语境下都能互相替换”的科学概念;而且,异体字只有在共时层面上使用才有分辨的价值也才能分辨得清楚,不论它形成的时代如何,共时同用是它必要的条件。这些,在学术界对于多数学者已成定论。不过,这样严格的异体字虽然为数不是太多,但在现代使用领域完全确定下来一时半会儿也是有困难的。此前,跨时代的大型综合辞书整理“异体字”,由于定义不严、加上面对字料的泛时性,实际操作相当困难,确有越整理越乱的弊病。新的规范汉字表如果沿袭过去的做法,实在难以给应用领域带来方便。所以,一方面,对待真正严格的异体字,“正字”的概念是必须坚持的,只要从正面规定规范字形,在现代文本的印刷和书写上就可以有据可依;另一方面,不强调“取消”这个概念,就可以避免“错杀无辜”,专业层面上又不会感到不便。在普及层面上,哪些字属于严格异体字,不能与正字同时使用,也许会有些分辨不清,可以通过《现代汉语词典》这种权威的规范性辞书作为知识来引导,也可以通过专家的研究来影响大众,这样宽松的处理,造成的负面效应可以避免,暂时执行后,对异体字的整理可以有时间进行,成熟一批宣布一批,对各个领域都是有利的。
(3)“类推”问题:
在简化汉字推行的过程中,实行了一个“类推”的原则,就是对某些简化的部件,类推到未简化的字上。这个原则在有限的范围内施行,似乎对保持汉字构形的体系有一定的作用。但是,由于类推本来就是汉字书写者容易使用的一种社会用字心理,近十年来,类推已经在无限扩大,对汉字产生了极大的扰乱作用。不限部位、不限层次、不限功能的无限类推,在汉字本来数量繁多的情况下,又人为的造出大量历史上从来没有使用过的“人造字”,给使用领域带来更大的不便。更荒谬的是,在辞书编纂时,有些辞书对贮存领域的字成批类推,改造了历史汉字的原形,违背了辞书存储汉字的历史真实性原则,这是既违背汉字的科学性,又违背汉字的社会性的。更有甚者,类推原则又被使用到所谓的“新旧字形”上。新字形是对旧有的宋体字书写属性的改造,如果把新字形与所谓的“旧字形”对照起来,它们之间是异写字的关系;而且,这些新字形大多数也是从历史字形中选出的,也是符合真实存在的原则的。其实,过去的新字形属于字样的规范,只是对个体字形的一种优选,而且只不过涉及7000个字形,对整个汉字规范的影响是积极的。但是,现在由一些辞书列出的新旧字形对照大部分是部首或部件,而它所涉及的范围又绝不只是那7000个通用字,在辞书处理字形时,对一些7000字以外的没有进入通用字表的字大量类推。这样就改出了一大批完全没有被使用过的字形,增加了毫无用处的异写字字样,实际上使汉字的总体系统繁化甚至混乱。类推原则由于违背科学性,给汉字的贮存与使用带来了大量的弊病,新的规范汉字表无论如何不能再无原则地使用了。但是,已经类推的常用字已经成为普及层面使用的习惯,不便大量修改。因此,在常用字、通用字范围仍然不得不继续遵循,而在专用字集里,应当受到限制,以免造成不必要的混乱。
(4)扩大规范字量的问题:
过去的规范字只限于通用字范围,现在,国际通用的GB13000字符集已经扩充到20902个字样,原有的7000通用字已经不够用了。新的规范汉字表应当增设专用字集。根据社会的需要,专用字集包括人名用字专集、地名用字专集、科技用字专集。其中人名用字专集收集通用字以外的人名专用字,是大家最为关心的。
人名专用字集不是现在人名已经使用的汉字的描写,而是要收入切合取名字的汉字,以为今后取名字的使用范围。在现在用做名字的汉字中,首先要排除生僻字,也叫疑难字,包括以下四类字(注5):
第一类,是音义不全的字,字典上面有形,但有音无义或有义无音,这些字多半是在字典收字时横向合并或历史传承时整理不彻底以及转抄错讹造成的。有的字可能在哪个碑石或手抄书上偶然出现了一次,也有些可能从来就没有用过。这种字害得一些文字学家和文献学家花很大的功夫一个字一个字去考证,其实,考出来也不会有太大用处,不过是一堆“死字”。这些字不是不能念就是没讲头,你怎么用来取名字啊?“名”底下从“口”是要人叫的,没有音怎么叫?起名字希望它有文化内涵、合乎一定的理据,没有意义,怎么实现这些要求?
第二类是指已经被现代楷书取代了的隶古定字字形或者过渡字形。隶定字形是为了在称说古文字原形时对它进行描写的,这些字在隶变以后还有一个通行的传承字,例如:“叜”是“叟”的隶古定字,既然有“叟”,何必用“叜”!过渡字形是一些字书为了讲解其他的字而设的,比如:“圥”可以构成“坴”,“坴”又可以构成“陸(陆)”、“睦”,《说文解字》就保留了“圥”。又如,过去,有人喜欢用三个字垒起来的字,还有四个字垒到一起的,例如有人叫章zhǎn(四个“工”字),这个字在《说文解字》里有,就是小篆“展”的声符,当“工整”讲。在20世纪初期,这个字还有人认识,取名字到也无妨;到了现代,楷书的“展”已经不使用它做部件了,这个字在使用领域就作废了,除了专门研究文字的人,谁都弄不清楚它们的音和义,现代用它取名有什么意义呢?
第三类是不通行的异构字和异写字。和规范字音义全同只是写法不同的字叫异写字,音义全同而结构和它不一样的字叫异构字。这些字已经有了一个既通行又与它音义全同的字被大家认可,取名字何必非要用那些不流通的怪字呢?
第四种就是适应某一种方言的方音制造的方言字。香港的某些报纸充满了这种字。比如,“卡片”的“卡”,在香港写作一个“口”加一个“吉”。“吉”古音是见纽开口三等字,声母的确读[K],粤语保留的是古音,但是到了别的方言区,大部分“吉”和“卡”不同音了,它只适应广东话,所以很难认。这种字要用来取名字,就是成心不让别人叫,或者一辈子只在自己的方言区,不要到外地求学、工作或经商。
这四类字合在一起量非常大,应当属于随着时代发展被流通领域淘汰的字,建设适应当代的先进文化,不应当再用它。如果非要用这些字取名字,不光给社会带来很多麻烦,对自己也没有好处。比如你给小孩起一个名字,老师拿着点名册叫不出来。去看病,你的名字谁都不认识,大家都乱念。不是也带来许多烦恼吗?
这里要说明的是姓氏字的问题。姓和名不同,它不但是称谓的符号,还涉及婚姻、血统、祖籍,包括继承权等等复杂的社会问题,它不是任意选用的,是传承的,其中有些怪字,如果考不清楚来龙去脉,那就应当有一个算一个,估计也不会太多。
人们最担心的是规范汉字表的字用来取名字是否够用?是否会给人带来限制?新的规范汉字表的人名用字字集,要特别解放一些人民喜欢使用做名字的异体字,作为取名专用(人名之外仍然限用),例如“喆”、“堃”等。新的规范汉字表的总字量要达到12000—13000个不重复的字,从数量看,取名字基本够用了。这么说的根据,可以从中国古代典籍的用字量来看:古代童蒙识字的课本《三字经》、《百家姓》、《千字文》,不重复的字种数是1462个,宋代通行的四书《大学》、《中庸》、《论语》、《孟子》,总字数56764个,不重复的字种数也只有2320个。宋诗18000多首,字种4520个。字量很大的《十三经》,字种数也超不过6000个。楷书从魏晋开始成为主用字,魏晋至清代的手写文本(文学、杂记)抽样5744000多字,也只得到适用字种12760个。从这些数字大致衡量,12000—13000字用来取名字,应当够用了。
简繁不对应的问题:
简繁不对应,也就是所谓的“一对多”的问题。由于同音借用简化字的通行,也由于不严格异体字不恰当的合并,产生了较多的异词同字现象,的确给使用带来不便,但是,大量改动异词同字情况,恢复繁体字,必然给普及领域带来麻烦,引起社会学习和使用上新的不方便。而完全无视这种现象,却会对专门领域造成很多误差,影响效率和质量。这种情况要求我们,在修订规范汉字表时,要慎而又慎。可以这样设想,我们是否可以定出一些原则,来控制改动的数量,尽量少改一些?但是,汉字的分布是一个完整的体系,牵一发而动全身,例如“干”字在简化字里承担了“干犯”、“枝干”、“干事”、“干燥”等义项及其相关的引申义,产生了一对四的情况,歧义过于严重,而且,“干”所对应的四个繁体字都能单用,无法借助双音词分开。加之四组意义都是高频词,意义负荷过重。有人主张将繁体字“亁”恢复。但是,一旦以“亁”的恢复为样板,与“亁—干”情况相同的“一对多”字组,大约有9组之多。恢复9组繁体字,专业领域会不会认为是一种修修补补,没有解决根本问题,而在我国教育的普及还没有完全到位,人民的汉字素质还不很理想的情况下,会在普及层面上引起什么波动,却是很难预料的。还有一个教训应当吸取,那就是在处理一些问题,对某些已经规定的事情做个别调整时,最忌在没有全面研究的基础上,灵机一动,想到什么改动什么,结果常常是改了这里,那里的矛盾又显露出来,人们把这种缺乏总体规划的个别改动称为“添乱”。为了避免“添乱”,我们是否应当首先考虑到全民的需要,暂时维持原状,等待时机成熟,经过研究深入,再统一改动。这样做,并不是对群众的意见置若罔闻,也不是有意违背汉字的科学性,而是避免在条件不成熟的情况下产生新的矛盾,从另一个角度违背科学规律,造成社会的波动,反而在以后合理处理这一问题时,产生更大的阻力。至于计算机简繁字自动转换产生的问题,还不都是简化字本身的问题,很多是可以通过扩充和修改词库、设计更多的自动转换技术来解决的,并不会过多地影响海峡两岸的沟通。
总之,理想的汉字规范应当认真协调汉字的科学性和社会性。从上面所举出的例子看,有些问题的确是社会的不同领域由于文化水平的差异和使用汉字专业程度的差异要求不同所造成的矛盾。汉字的使用必须切合全民利益,不能忽略普及领域的要求——这一领域人数众多,分布很广,影响很大,他们要求保持旧有习惯更多些;也不能忽略专业领域的要求——这一领域虽然人数较少,但他们是大规模汉字的使用者,又是社会用字和文化传承的主导者,在某种意义上,他们通过政治、经济、文化、教育、出版事业,能够产生的社会影响更大。他们从自己的工作和经验出发,对科学性的要求是十分迫切的,忽略了他们的要求,也是会产生社会问题的。要想完全顾及各个领域是难以作到的,但只要我们具有这两个不同领域的意识,尽量兼顾大家的要求,很多问题的调节是可以相对作得好一些的。
在考虑到不同社会领域的要求后,科学性与社会性二者应当互相制约、并不矛盾——汉字客观规律的形成与它的社会背景有密切的关系;而社会对汉字的人为调节,无论如何不能违背它自身的规律。我们应当用这个标准来衡量一个世纪以来汉字规范的实践,并且作好新的规范汉字表的研制工作。
本文初稿经曹先擢、李宇明、王铁琨先生阅读后提出了有价值的修改意见,在此一并致谢。
2006,9修定
(注1):《论汉字规范的社会性与科学性》一文,发表在《中国社会科学》2004年第三期。这次发表的《再论》,是《论汉字规范的社会性与科学性》一文的延续,其中个别地方由于全面论证的需要,重申了《论汉字规范的社会性与科学性》一文的说法,但这些说法都有新的发展,为行文简洁,不再注明。
(注2):这个字表1956年2月1日正式实施。
(注3):1986年国家语委重新发表《简化汉字总表》时,对1964年的字表作了某些调整。
(注4):见章炳麟《国故论衡•转注假借说》。
(注5):关于生僻字的解释,我在2003年6月11日接受中国语言文字网站关于人名用字规范的采访时已经说过,采访录在《中国教育报》上也已经发表,这里的意见是对采访录的复述。