沉重的《通用规范汉字表》
高国鹫
今年8月12日,酝酿八年的《通用规范汉字表》征求意见与广大读者见面了,该表的颁布是人们生活中的一件大事,与百姓的生活息息相关,因此对该表“百般挑剔”,是为了能够经受历史长河考验。下面是自己的学习体会,不正确之处请批评指正。
一 沉重的《通用规范汉字表》
1、该表对《现代汉语常用字表》(1988年)、《现代汉语通用字表》(1988年)进行了修订与整合。
与以往字表不同的是,《通用规范汉字表》8300字是从近百年来各种刊物数亿汉字中统计整理出来的,具有普遍代表性,一般人写文章纵使有“一筋斗云十万八千里”想跳出这一范围都很难,从这一点看《通用规范汉字表》冠以“规范”作用不大;考虑到在特殊领域有可能突破这一界限,因此字表规定“字表以外的字,必要时仍可使用,但宜采用历史通用字形。”正是开了这一小口,《通用规范汉字表》冠以“规范”意义不大,《通用规范汉字表》与其它字表或字符集等国家标准是等价的。
2、对《简化字总表》扩充了265个简化字(原简化字取消了49个),简化字类推范围定为8300字。
1)简化字扩充不利于海峡两岸文字的统一,会越走越远。《通用规范汉字表》是在8年前着手制定,时至今日与8年前相比,海峡两岸关系已不可同日而语,目前国内很多部门的工作都在致力于维护海峡两岸统一,所以《通用规范汉字表》的研制是否也应与时俱进,要顾及到海峡两岸文字的统一。
2)对简化字类推范围,《简化字总表》规定是:“《简化字总表》并不是一个严格封闭型的字表。如果通篇采用的是简化字,其中个别繁体字在《简化字总表》中找不到它的简化字形,而构成该繁体字形的偏旁已经简化,那么,一般说来,这个繁体字形也应该根据偏旁类推简化的原则予以简化。”《通用规范汉字表》规定改为:“……本字表以外的字,不再类推简化,个别领域确需类推简化的,需报国家语言文字工作主管部门批准。”
这次把简化字类推范围由开放式修改成封闭式,顺应了民意,但操作起来有难度,例如写一篇科普文章投稿,遇到了《通用规范汉字表》之外类推简化字,报批需要等待多长时间?能获得批准吗?不能获得批准该怎么办?也不可能是申报一个审批一个,因此这篇文章很可能”石沉大海”。即使获得了批准又怎样?可能一时也打不出字来,因为这涉及计算机字库补充新造字、汉字输入法调整、字表修改等一大堆遗留问题。
3)《通用规范汉字表》对简化字的修改与原《简化字总表》一样,也不符合常用趋简原则。
汉字演化基本规律:(1)主流是常用趋简,(2)其次是约定俗成。在这里第一条是最基本的,有了这条第二条就很容易实现,汉字就会和谐发展;如果没有第一条,硬性推行第二条,汉字演化就会偏离轨道,这种简化就是不完善的,会带来很多遗留问题。
1956年制定的《汉字简化方案》之所以得到了人们普遍称誉,是因为遵循了常用趋简这一基本原则,因此约定俗成是有成效的。但在后来简化中,主要是基于下面两点考虑:(1)
因此,《简化字总表》违背了常用趋简这一基本原则,只是按约定俗成构成的字表,而这种约定俗成是不牢固的,一旦条件发生改变就有可能松动。例如《简化字总表》对类推简化是开放式的,这在当时人们可以接受,但是到了五十年后汉字数字化的今天,这需要配备庞大的简化字库,人们就不能容忍了,一致要求调整成为封闭式的,我们要吸取这一教训。然而,《通用规范汉字表》并没有按常用趋简这一基本原则进行修改,虽然是把简化字类推范围改成了封闭式,但并没有封死,需要报批。因此,《通用规范汉字表》仍然只是按约定俗成构成的字表,这种约定俗成是否牢固尚需时间检验。
3、对地名、人名用字进行了限定。
汉字是个大家族,现代汉语通用字有七八千,传承字有七八万甚至更多些,对于通用字人们天天在使用属活字;对于七八万传承字,也要搞活不能成为古董字,当然,让人们去写古文、作古诗已经不现实,目前唯一能够做到的就是姓名用字的放开,虽然在这一领域用字量不大,但却有利于把传承字搞活,例如原来称作生僻字的喆、淼、堃、昇,正是通过姓名的流通,这次才被收入到《通用规范汉字表》,而该字表一旦颁布,会割断与传承字的流通,不利于汉字未来发展。
汉字是和谐的,对其它外来文字具有一定的亲和力,也就是汉字可以和字母直接连在一起,这就是字母词。字母词主要用于表示事物的形状、标准、型号、顺序等,例如“U形钢”、“S形转弯”、“GB”、“IP电话”、“B超”、“X射线”、“卡拉OK”、“A级”、“B楼”、“维生素C”。字母词的产生是汉语言文字和谐发展的结果,是汉字最大限度为人类服务的表现,顺应了民意,很多字母词已被现代汉语词典收录。基本可以认定:字母词中字母是汉字的延伸,字母词大量使用属规范汉字范畴,也符合国家通用语言文字法。
前不久,江西人“赵c”在更换二代身份证时,根据《姓名登记条例(初稿)》规定姓名中不得有字母为由要其改名再办理,形成一场引起社会各界广泛关注的姓名权官司,在一审判决中“赵c”胜诉,在二审判决中经过反复协调,“赵c”更改了名字。
这场官司争论焦点是作为人名“赵c”含有字母,是否属于规范汉字范畴,是否满足国家通用语言文字法。这首先要判断“赵c”是否是字母词,如果是字母词,那么“赵c”就属于规范汉字范畴,也满足国家通用语言文字法,那怎样判断呢?
什么是字母词?尽管在学术上有争论,但最基本的衡量标准应是:(1)由汉字和字母组成(也可完全由字母组成);(2)要有一定含意或所指;(3)容易记忆和方便传播;(4)遵循约定俗成规律。如果按照上述定义标准,“赵c”已经成字母词了,因此“赵c”中的字母属汉字延伸,使用属规范汉字范畴,也符合国家通用语言文字法。
下面再佐证:有三座相似的楼在售楼时称“楼a”、“楼b”、“楼c”;有同性别三胞胎在玩游戏时称“赵a”、“赵b”、“赵c”,若前者是字母词,后者亦应是。
但是,“赵c”能否用于人名是另一回事,换发二代身份证可以拒绝“赵c”用于人名,但不宜以“赵c”不符合规范汉字为由,因此《通用规范汉字表》冠以“规范”,对字母词的界定容易引起争议。
如何看待用生僻字或字母起名现象,《通用规范汉字表》采取阻截方式,把起名用字限定在8300字范围内,这种做法忽视了对新生儿家长的疏导工作。
在给新生儿起名中,用生僻字或字母起名是两个极端,都不利于孩子的成长。孩子外向又比较聪明,名字中含生僻字,主动让老师提问的机率比较小,需要一定时间磨合;孩子内向、名字中带有字母或符号,被动让老师提问的机率比较大,如果每每答不上来是很尴尬的;而用两极端中间汉字起的名字叫中性名字,这样的孩子不靠名字来标新立异,而是要靠自己的努力来求得同学和老师的认同,这对孩子的未来成长大有益处。当然,如果家长喜欢生僻字或带字母的名字可用作孩子乳名。另外,即使个别家长给子女起生僻字名或字母名,也不要大惊小怪,因为这种名字在社会不会多,而且要冒很大风险,对汉字发展也未必是坏事。
从上面分析可以看出,8年前在制定《中华人民共和国国家通用语言文字法》时,因在学术上对“规范汉字”的定义争议比较大,因此没有给予定义,可由有关部门进行解释。如今在对“规范汉字”进行定义时,也不是《通用规范汉字表》能够完全涵盖的。《通用规范汉字表》如果用三个修改后的新版字表:《简化字总表》、《现代汉语常用字表》、《现代汉语通用字表》表述,这可能会更好些。
二 《简化字总表》修改之我见
汉字繁、简之争由来已久,几乎是随着上世纪五十年代简化字的制定时就开始了,如今已经争论了五十多年,这次《通用规范汉字表》一旦颁布,为五十多年的汉字繁、简之争画上了句号,但随之而来的将是迎接下一个简化字的五十年,届时能否避免重新燃起汉字的繁、简之争,这是人们最为关切的,下面谈谈对《简化字总表》修改的个人见解:
《简化字总表》分三个表总共2235个简化字,其中第一表是不作简化偏旁的350个字,第二表是可作简化偏旁用的132个简化字和14个简化偏旁;第三表是根据第二表类推出来的1753个简化字,但在实际应用中,对超出总表范围的字允许类推简化。
在《简化字总表》中,按照类推能力的大小,可把类推简化字分成两类,一类是类推能力比较弱,例如“备笔边尝虫带动断对队归龟过画汇荐节进举壳灵刘虏卤录买迁亲穷杀双献写业艺荫隐犹”,每个都只有一个类推简化字;另一类是类推能力比较强,例如最强的是“钅”可类推出216个简化字,像这样类推能力最强的简化偏旁有12个,按照类推能力强弱分别是“钅讠纟贝鱼鸟车门马页饣见”,它们总共类推出了1185个简化字,占《简化字总表》的53%。因此在《简化字总表》中,类推简化字占主体,在类推简化字中,由这12个简化偏旁类推出的简化字占主体。
在人们书写中,如果一篇文章同时出现上述这12个繁、简偏旁字,例如“鲤、鱤”两字,或“钢、鑱”两字,人们肯定不会接受,还有“乌”的繁、简偏旁字也属此类。那采用什么方法解决好呢?主要有以下三种(完全恢复繁体字不在本文讨论范围之内)解决方法:(1)能类推简化的字都随之简化;(2)字表外能类推简化的字报国家语言文字工作主管部门批准;(3)恢复类推功能极强的12个简化偏旁繁体字形“釒訁糹貝魚鳥車門馬頁飠見”。
上述第一种方法是《简化字总表》处理方式;第二种方法是《通用规范汉字表》处理方式;第三种方法是笔者提出的《〈简化字总表〉调整建议方案》①处理方式。
《〈简化字总表〉调整建议方案》是按常用趋简原则对《简化字总表》进行修改。如果人们能够接受这12个简化偏旁恢复成繁体字形,那么《简化字总表》中的2235个简化字可减少到1050个,这时繁、简字的边界在《现代汉语常用字表》与《现代汉语通用字表》之间,这是不可以的。在《简化字总表》中“厌”的繁体字是“厭”,类推简化字有6个“恹厣靥餍魇黡”,对应繁体字是“懨厴靨饜魘黶”,而这6个类推简化字都不是《现代汉语常用字表》用字,根据常用趋简原则这6个类推简化字可以取消。因为“厌”字类推功能不强,因此在一篇文章中同时出现“厌、懨”两个字,人们可以接受吧!再如“齿”的繁体字是“齒”,类推简化字有12个“龀啮龆龅龃龄龇龈龉龊龌龋”,繁体字是“齔嚙齠齙齟齡齜齦齬齪齷齲”,在类推简化字中只有“龄”属《现代汉语常用字表》用字,因此在类推简化字中只保留“龄”就可以了。这时在一篇文章中同时出现“齿、龄、齲”三个字,人们也可以接受吧!这样简化之后,简化字总数可控制在600个左右,接近于1956年制定的《汉字简化方案》,类推范围就可控制在《现代汉语常用字表》3500字范围内(如不够用可对常用字表适当扩充)。
按照常用趋简原则对《简化字总表》进行修改,虽然是一次较大的“折腾”,却能保持数百年甚至上千年的相对稳定,不存在遗留问题,因此这种约定俗成是牢固的,从根本上解决了汉字的繁、简之争,为海峡两岸汉字书同文奠定了基础。当然,一次修改这么多简化字需要有过渡期,可选用一种(或几种)报刊用两种方法分别出版,让人们逐渐适应,这也是接受市场检验。
三 中华地名、姓氏的保护与规范
中华地名和姓氏历史悠久,具有传承性,至今已延续五千年。其选择是一种文化现象,有独特的传播渠道和客观发展规律,每一个地名、姓氏的背后都能挖掘一个动人的故事,因此具有重要文学艺术价值和科学研究价值,并且至今没有遭破坏属原生态资源。
在社会发展进程中,随着老城区改造,历史遗存所剩无几,失去的不能再找回来。随着计算机、互联网普及和地籍、户籍现代化管理,地名、姓氏的保护与开发之间的矛盾也日益突出。《通用规范汉字表》征求意见,就有乡镇以下生僻地名和上千生僻孤姓未能收入,意味着这些生僻用字面临改名的命运,然而,对这些稀有资源今天若不去善待和保护,一旦失去了还能找回来吗?
《通用规范汉字表》作用有三:一要作齐——整合字表;二要作全——适于各个领域的汉字应用;三要作强——规范之上。这样地籍、户籍管理用字也要纳入到字表中,因为地籍、户籍用字历史悠久,不但多而且杂,含有不少生僻字,为了让字表不至于急剧膨胀,只能对乡镇以下生僻地名和生僻孤姓忍痛改名,这些字将退出流通领域,这与当前汉字编码弱势有着直接的关系;而收集到字表内的地名和姓氏用字,为了统一繁、简字形,新产生了二百多个类推简化字,这些字的简化实属不得已而为之,如果《简化字总表》能按常用趋简原则进行修改,也就不存在这一问题了。
四 关于汉字编码的反思
汉字编码,这曾让人又爱又恨,三十年来不知多少人士(包括软件公司和个体编码人)着迷过,为了寻找简单、快捷的汉字输入法,也不知倾注了人们多少心血,千呼万唤始不出。在换发二代身份证时,又推出一些大字符集汉字编码,但又无一不暗然退出,最终导致把地籍、户籍用字限定在8300字的《通用规范汉字表》。专家在谈该字表对百姓生活影响时指出:有些特别生僻的字,电脑虽然已经编码,但是输入法不支持,就是人们常说的打不出来……。
汉字编码如今真的走到尽头了吗?
目前,由于认识上的差异,人们重在制定和推行汉字编码规范,而对汉字编码理论研究投入不足,理论滞后于编码发展,理论与实践相脱节,这是造成当前汉字编码虽多但又不适用的根源。例如,很多人都会认为汉字编码遵循的是约定俗成,这就是汉字编码规范②阐述的原则,认为规范是不能突破的,只能在规范约束下开展编码活动。但是,实践是检验真理的标准,三十多年的汉字编码已经证明,沿着这条路再走下去,前面已经没路可走了。
其实,汉字编码是有规律可循的,汉字编码规范应在汉字编码规律下的约定俗成。这意味着汉字编码规范也不是一成不变的,要随着汉字编码方法的改进而建立新的规范标准来达到新的编码统一,而不应是用旧有规范简单否定。可以肯定地说,只要掌握了汉字编码规律,人们期待的简单、方便,不但适用于普通用户,也适用于地籍、户籍管理的大字符集汉字编码方案就一定能产生。现在不清楚的是:这种方法一旦产生了,那对地籍、户籍管理用字还要限制吗?
注:①见语言文字网(www.yywzw.com)
②目前最重要的两个汉字编码规范是(1)用于计算机编码的CF 3001-1997汉字部件;(2)用于手机编码的GB/T 18031-2000数字键盘字母键位设定。
启示:
该出山时就出山
在“专家谈《通用规范汉字表》对百姓生活影响”一文中,教育部领导和两位文字学家多次谈到有些地名、姓氏用字比较生僻,电脑里虽然都有,但一般输入法不支持。
现在可以告诉大家,由笔者研发的汉字拼形输入法,已经做到了大字符集字库与简单、方便输入的合二而一,完全支持地籍、户籍管理中生僻字的简单输入,请有关部门及专家审阅。
汉字拼形输入法按汉字笔顺规则表,一次输入单笔画或多笔画汉字结构,这是除了笔画输入之外唯一的长码方案,最大码长12键,从而确保了大字符集(7万字以上)汉字输入的简单化,适宜普及,也为汉字的排序奠定了基础。在实际应用中,汉字拼形主要是挂接到中值码输入法中。
中值码汉字输入法用于输入通用字(7000字以上)和词组。取汉字的三个要素:汉语拼音首字母,汉字拼形首、尾字母。在输入中:一键是单字简码;二键是双字词简码;三键是输入汉字;四键是输入词组。
中值码挂接了汉字拼形和汉语拼音。在输入中,凡遇到读不出的字(包括生僻字),只要按U键,进入大字符集字库,采用汉字拼形输入方法;凡遇到写不出的字只要按V键,进入汉语拼音字库,采用全拼输入法。挂接的输入法只能输入汉字,不能输入词组。
中值码适用于普通用户日常汉字输入,作家、记者、教师等语文工作者文章写作,文字学家、考古工作者古汉语写作,邮电、金融、交通、地籍、户籍等部门打字输入,尤其适用于初学或中老年人汉字输入。
中值码汉字输入法分为:中值码G、中值码K、中值码D三个标准,三者之间区别仅仅在于挂接的汉字拼形版本的不同,中值码G挂接的汉字拼形是GB2312(含6763字)、中值码K挂接的汉字拼形是GB13000.1(含20902字)、中值码D挂接的汉字拼形是GB18030-2005(含70244字)。
中值码G已经完成、中值码K接近尾声,中值码D近期完成。《汉字拼形输入法》书稿正在编写中。笔者研制的最新汉字编码理论已经写成了二十多篇论文,目录附后欢迎查阅交流。
目前中值码G汉字输入法近期(年内)可作成互联网下载软件,届时欢迎品尝。
目前在《语言文字网》(www.yywzw.com)已发表的文章有:
1 《汉字编码三大定律》
2 《笔画组合理论与汉语拼形方案》
3 《数字键盘复码字母键位设定原理》
4 《挑战天下编码人》
5 《汉语拼形汉字输入法》
6 《汉字编码——未来推动汉字演化的动力》
7 《关于汉字编码第二次整理探讨》
8 《论汉字编码数学原理》
9 《汉字编码与密码设置》
10 《汉字编码与互联网域名》
11 《汉字编码与电话号码》
12 《汉字编码与邮政编码》
13 《字母异化·数字异化·汉字编码》
14 《汉字编码——对汉字简化的“否定”》
15 《简化字总表》调整建议方案
16 《阿拉伯数字的遗憾》
17 《当前汉字编码急需解决的十个问题》
18 《〈汉字笔顺规则表〉修改建议方案》
19 《手机互联网输入法》
20 《关于“中华姓氏”申报世界非物质文化遗产的倡议》
21 《沉重的〈通用规范汉字表〉》
近期要发表的文章有:
22 《遭遇汉字编码危机》
23 《汉字(编)码的最终归宿》
24 《汉字拼形输入法简介》