汉字“书同文字”之大思考江西 任文 【内容提要】本文从汉字的繁简和正异、语同音、字形和字音规范、字典编纂和信息处理等与书同文的密切关系入手,畅谈了自己关于书同文的总体性思考,提出了不少新颖见解。譬如把汉字简化区分为对称简化和非对称简化;主张异体字的整理应以典籍用例的汉字为限,并且要在“剔除无典籍用例义项,剔除方言读音及义项,剔除不通用的方言字”的前提下进行整理;主张要重新审定声母与韵母的搭配关系等。 【关键词】汉字 书同文 编码 字典 汉字的统一,就是使汉字“书同文字”。汉字“书同文字”要做到三个面向:“面向社会,面向现代化,面向未来”;三个有利于:“有利于书写,有利于认知,有利于信息处理”;同时还要坚持“古为今用,推陈出新”。 文字不能脱离语言而存在,书同文应与“语同音”相结合;信息时代,文字不能脱离电脑和汉字编码而存在,书同文应与“字同码”相结合,“文字规范”应与“编码规范”相促进。 书同文应注重原则性和灵活性相结合,具体问题具体分析,特殊情况特殊处理,防止机械套用和泥古不化。 研究汉字,不能脱离词汇及语言环境而单纯地“就字论字”,否则形成不了共识。有漫画为证:桌上放着一个“干”字,甲说是“干”字,乙说是“士”字,丙说:你们都对!但你们又都不对!! 本文把“书同文”与“语同音”及“字同码”三者结合起来,就如何广泛、深入、合理、有序地进行汉字“书同文字”的改革进行大思考。 一 关于汉字简繁与书同文的关系书同文要处理的第一大难题就是汉字的简繁问题。目前,大陆以简化字为规范字,台湾以繁体字为规范字,从而造成了汉字的简繁矛盾对立,“一国两字”的存在,严重干扰了汉字信息的处理及两岸的民间交流。 汉字避繁趋简是不可逆转的历史的必然。笔画繁杂的汉字一定要淘汰,现有的简化字要重新审视,简化好的要敢于采纳,简化不好的要主动放弃。汉字书同文后,就只有“规范”与“非规范”标准之分,绝无简与繁或正与异标准之分,也不存在计算机简繁转换问题。凡一切非规范字,对任何人、任何事(古籍研究除外),在任何场所都应限制使用,在国家“通用语言文字”法律面前,应人人平等,事事平等。 为了合理用字及控制汉字的用字数量,有典籍用例而没有类推简化的汉字要类推简化;没有典籍用例只存在古代字书或注释书中的偏僻汉字,不要简化;有典籍用例但可作异体字淘汰处理的繁体字,也不要简化。 目前,汉字的简化大致可以分为两种形式:对称简化和非对称简化。大部分汉字属对称简化,只有少部分汉字(117组)属非对称简化。非对称简化的汉字虽然少,却是汉字简化中争论的重点,这种简化方式的存在,造成了许多人对汉字用字的不习惯。非对称简化分为两种形式: 合并简化:把两个不同的繁体字进行义项合并后简化成一个新汉字。如:汇—滙彙,将“滙”与“彙”两字的含义合并后简化成“汇”。 在合并简化中,有些汉字合并简化得不合理,应解除简繁关系,恢复使用繁体(须类推简化的,仍须简化),这类汉字有:摆—襬、当—噹(拟声词)、恶—噁(用于“恶心”一词)、须—鬚、苏—囌(口+苏)、坛—罎(缶+昙)。 归属简化:把一个或多个繁体字的义项归属到一个笔画少的汉字上去,使用笔画少的汉字为通用字。归属简化严格来说不是汉字的简化,而是汉字异体的整理。 归属简化分为两种形式:同音归属简化和异音归属简化。如: 雲(云)—云,属同音归属简化,把“雲”的含义归属于“云”。“云”与“雲”构成简繁关系。 癥(症)—症,属异音归属简化,把“癥”的含义归属于“症。“症”与“癥”构成简繁关系。 在归属简化中,有些汉字归属简化得不合理,应解除简繁关系,恢复使用繁体(须类推简化的,仍须简化),这类汉字有:儿(er2)—兒(音ni2)、价(jie4)—價(jia4)、拒(ju3)—櫃(gui4)苹(ping2)—蘋(pin2)、系(xi4)—繫(ji4)、旋(xuan2)—镟(xuan4)、台—颱、表—錶、刮—颳、胡—鬍、困—睏、帘—簾、千—韆()、秋—鞦、涂—塗、余—餘、朱—硃。蒙—懞濛矇。 在归属简化中,有些汉字归属简化得不合理,应解除简繁关系,将繁体重新作另一字的异体予以淘汰。如: 松—鬆,解除两者的简繁关系,根据与“紧”相对的原则,应使用“”做规范字,“鬆”应作“”的异体淘汰。 面—麵,解除两者的简繁关系,根据适应汉字编码的原则,应使用“糆”做规范字,“麵”应作“糆”的异体淘汰。 这类汉字须调整的有:别—彆(蹩)、卜—蔔(菠)、仇—雠()、板—闆(钣)、冬—鼕(咚)、姜—薑(葁)、咸—鹹(堿),曲—麯(酉+曲),发—髮()。 在汉字的简化中,存在两种特殊简化方式:一是过渡简化,二是撤并简化。 过渡简化:把一个繁体通过另一个汉字做跳板简化成相应的简体。这是少数汉字的简化方式。如: 斗—鬥:从表面上看,很难想像“鬥”会简化成“斗”,觉得这种简化不合情理,但通过弄清它的简化方式,就会明白这种简化合情合理。简化方式为:鬥→鬦(閗)→斗,它采取了先复繁后简化的手段。 坛—墰壜:过渡简化方式为:墰→墵→坛;罎→罈→墰→墵→坛。并非有些人所指责的“滥用云”。但这种简化方式并不好,不但易让人把“坛”读成yun2,而且打乱了从“云”汉字的音系(yun)。“墰”与“罎”不能合并简化为“坛”,应分开使用。对“墰”的简化应寻求一种更合理的方式,那就是:墰→壜→土+昙。“墰”简化为“土+昙”,“罎”就顺理成章简化为“缶+昙”。 仅—僅:“漢、嘆”的右边部分已完全失去了表音作用,只是一个存在的符号而已,既然如此,不如用一个更简单的符号取代。其轮廓远看像“又”,利用模糊原理,用“又”代之。模糊原理是当今解决复杂问题的巧妙手段,信息家电正因使用了模糊原理,才使生活变得更简单。因此“漢、嘆”简化成“汉、叹”应无可厚非。 但“僅”又是如何简化成“仅”的呢?,原来它也是使用了过渡简化方式:僅→傼→仅,这种简化并没错过。 由于过渡简化方式是一种隐形简化,采用的是一种“移花接木”的手段,因此,让许多人迷惑了眼。 撤并简化:犹如机构改革,把一个单位的部分或全部职能划归其它单位,再撤销其它部门,把其职能划归本单位,单位职能变了,名称未变。如: 廣—广(庵):把广的原含义归属“庵”,把“廣”的含义归属“广”。 属这类简化的字还有:廠—厂(庵)、蟲—虫(虺)、壊—坏(坯)、麽—么(幺)、寜—宁()、瀋—沈(沉)、體—体(笨)。 在撤并简化中,有些汉字本该划出去归属其它汉字行使的职能并没有完全转换过去,而是仍滞留在原汉字中,造成与划进来的职能(含义)不协调,这是改革的不彻底,应该深化这种改革,这类汉字有:衝—冲(土+中)、穀—谷(峪gu3)、劃—划(撶)、幾—几(机)、術—术(艹+术)、萬—万(亻末)、葉—叶(协)、籲—吁(嘘)。 二 关于汉字正异与书同文的关系汉字的数目过于庞大,会造成汉字应用上的混乱,应下大力气对汉字异体进行整理。汉字正、异字的整理应以典籍用例的汉字为限,并且要在“剔除无典籍用例义项,剔除方言读音及义项,剔除不通用的方言字”的前提下进行整理。经过异体整理及简化后的古今通用规范汉字,应是10000字左右。 异体字的整理,不能搞对称整理。异体字的整理,还要考虑汉字的编码信息的选优性,应按如下方式进行: ⑴尽量选用表意功能强的汉字为正体。如“尨”,指杂毛狗时,表意性能不强,应选用“狵”作为正体字,把“尨”作为异体字淘汰。 ⑵尽量选用适合汉字编码和汉字检索的汉字为正体。如:“稃”与“麸”的表音表意功能都很强。“麸”仅指小麦的皮屑,“粰”却指所有草本植物包括水稻、玉米、小麦、草籽的皮屑,应用范围更广。从汉字编码上来讲,“稃”比“麸”更好编码(键面上会考虑安排字根“禾”却不一定会安排“麦”),因此应选用“稃”为正体,淘汰“麸”。 ⑶应排除方言用字的干扰。我们所说的书同文,应是“普通话”或“通用话”意义上的书同文。可以这么说,任何汉字,在不同地域,都有它的方言性,如果过分强调因方言的存在而阻止汉字的异体整理,那汉字定量工作就永远无法进行。 三 关于汉字语同音与书同文的关系汉字的读音非常复杂,一字多音现象比比皆是。读音问题不解决好,将直接影响人们的日常交往。解决读音问题,就是要进行“语同音”。“语同音”与书同文密不可分,只有先解决书同文,才能解决“语同音”。“语同音”应该是“普通话”或“通用话”层面上的“语同音”,不要受方言的影响而产生思想的错乱。除少数常用汉字可以保留“一字二音”外,其他汉字尽量要求严格做到“一字一音”。 ⒈按照“声韵一致”原则转化多音字读音⑴强:①qiáng坚强,②qiǎng强迫,③jiàng倔强。废除②qiǎng,③jiàng,统读①qiáng,把“倔强”的“强”写成“亻强”,并同时把表“固执”的异体字“犟、勥”淘汰。 ⑵蒙:①mēng瞎蒙蒙骗,②méng蒙面,③měng蒙古。废除①mēng,③měng,统读②méng。并对义项作如下转化: A表示“欺骗,猜想,愚昧,地名”时读写成蒙(méng),如“蒙骗、瞎蒙,启蒙,蒙古”。 B表示“昏迷,神智不清”时读写成懵(měng),如“懵懵懂懂”。 C表示“细雨”的时候读写成濛(méng),如“情深深,雨濛濛。” D表示“模糊”时读写成矇(méng),废除“蒙胧,朦胧,曚昽”统一写成“矇眬”。根据光学“反射”与“逆反射”原理,日光不明(曚昽),月色不明(朦胧),景物不明(蒙胧)归根到底在于眼睛不明(矇眬)。 ⒉按照“表音一致”原则转化同形字读音同形字指具有同一表音形体(汉字或字符)而不同偏旁的一组汉字。从理论上讲,同形字的读音应是相同的,但在汉字漫长的历史演变过程中,由于地域关系,产生了读音分化。如“甫”读音fu,《新华字典》中从“甫”的汉字读fu音的有“辅、黼、鬴”;读bu音的有“捕、哺、晡、逋”;读pu音的有“铺,葡,莆,圃,匍,酺,浦”;既读fu音又读pu音的有“脯”;既读bu音又读pu音的有“埔”。这是典型的“b、p、m、f”不分造成的字音分化。根据“表音一致”原则,改“甫”音pu,从“甫”的汉字读音全部向pu音转化。 再如:漆:音qī,膝:音xī(旧读qī)。漆、膝属同形字,读音本应相同。膝废qī读xī,却无意间造成了漆、膝在声母q、x上的混淆。故而因废xī重新读qī。 ⒊重新审定声母与韵母的搭配关系汉语拼音普通话中,自身存在大量的声母与韵母的搭配(相拼)混乱关系。韵母与声母搭配最难区分的in与ing;声母与韵母搭配最难区分的是z、c、s与zh、ch、sh。卷舌音与不卷舌音跟韵母之间搭配的混乱关系,不但南方人无法区分,就是普通话的发源地北方人也无法区分。稍微留意,就会发现,南方人字字不卷舌,北方人字字卷舌。为明确声韵母之间的搭配关系,这里制订新的连姻关系。 声母 | 韵母 | z、c、s | i音系:i u音系:u、ua、ui、un、uo、uai、uan、uang | zh、ch、sh | a音系:ai、an、ao、ang e音系:e、ei、en、eng o音系:ou、ong | b、p、m、x、y | in | d、t、l、n、j、q | ing |
四 关于汉字通典与书同文的关系在汉字书同文的同时要对各个汉字的含义(涵义、含意)做全面、系统、统一、精致的规范,不要像目前那样,字典泛滥,各说各的,莫衷一是。应尽量删除只存在于古代字书及注疏中而没有典籍用例的义项,尽量删除通假义项,尽量删除方言义项(方言字和方言义项可在《方言大字典》中体现,不要在规范《通典》中体现)。 汉字的意义是通过字典来表现的,书同文的各种信息最后将通过字典来储存。这就要求组织专家精心策划和编辑《现代汉语正字通典》。《通典》的编著应与书同文同时进行。汉字书同文改革,牵扯的汉字太多,《通典》编著的好坏,关系到书同文的成果能否应用和巩固问题,关系到十几亿人的生活用字会否乱套问题,关系到汉字能否走向世界的问题,关系到《通典》本身是否实用的问题。编著《通典》是书同文中一件极为重要而又非常复杂的工作,因此有必要先“未雨绸缪”,对如何编著《通典》进行一番探讨,以免临时“抱佛脚”。 《现代汉语正字通典》的编辑,涉及到两个问题:汉字如何检索与正文如何编排。 ⒈汉字的检索方法目前字典中的检索方法有:部首检索法,拼音检索法,四角号码检索法及其它方法,各种方法各有利弊。汉字书同文后,汉字的读音得到规范,拼音检索法必不可少,但由于有部分汉字存在读音的特殊性,因此,部首检索法是首要的检索方法。目前的部首检索法要改革: ⑴把汉字分解为表意符和表音符,并规定表意符称“偏旁”,表音符称“部件”。部件有大小之分。汉字的构造方法是“笔画构成小部件,小部件加小部件组成大部件,部件加偏旁合成汉字”。 ⑵限定偏旁个数。目前,各类字典所使用的偏旁数目不尽相同,偏旁个数过多,会造成一个汉字含有两个偏旁,引起检索麻烦。因此须删除原字典中没有表意功能或表意功能弱或表意功能虽强但构字数偏少的偏旁。 根据适合和方便汉字编码和检索原则,偏旁总数应为130个(26键×5个=130偏旁),下面是笔者结合汉字编码优化选取并分类的130个偏旁: A五行类(20个):(阴阳)日、月。(五行)金、钅、木、片、竹、艹、廾、水、冫、氵、雨、火、灬、光、土、石、山、田。 B人体类(35个):(肢体)士、人、亻、彳、身、手、扌、足、⻊。(五官)口、囗、舌、齿、耳、阝、卩、目、鼻。(心理)心、忄。(关系)父、儿、子、女。(病死)疒、鬼、尸、歹。(言行)曰、言、讠、走、辶、廴、立。 C动物类(20个):(动物)虫、鱼、鸟、隹、牛、马、羊、豕、鼠、鹿、犭、虍、豸、(皮毛)骨、角、羽、毛、革、髟、彡。 D生活类(40个):(自然)白、黑、赤、风、气。(时间)辛、酉。(吃)禾、米、食、饣。(穿)衣、衤、巾、纟、糸、韦。(住)冖、宀、穴、广、厂、门、户。(行)车、舟。(用)王、贝、罒、皿、瓦、缶、刀、刂、斤、耒、弓、矢、殳、戈。 E其它类(15个):欠、页、丬、示、礻、冂、匚、勹、文、攵、大、见、力、方、寸。 ⑶对汉字进行偏旁归类。目前,对汉字的偏旁的归类还没有一个统一的认识,同一汉字在不同的字典中归类也不同,有的汉字甚至归类于两个(或多个)偏旁中,这真是“军功章里,有你的一半,也有我的一半”。 书同文的同时,需要对每一个汉字,按照上述130个偏旁进行归类,作出统一规范,以便利于教学和编码检索。对于不符合这130个偏旁的汉字,即所谓的“无偏旁”汉字,根据其起笔(第一笔画)按一、丨、丿、丶、乙归类。这就要求书同文的同时,要认真考虑汉字的取舍,尽量选择有偏旁,利于汉字编码的汉字为正体字,有时需要作出一点牺牲。如:表示小麦的皮屑时,习惯了用“麸”,但“麦”不属于上述130个偏旁之列,而“粰”的偏旁“米”属130个偏旁之一,且外延更广,尽管它不常用,从长远利益出发,应“忍痛割爱”舍“麸”取“粰”。再如:“鼉,黿”简化成“鼍,鼋”,仍然不适合书写,不适合认知,不适合编码,不适合检索,不如不简化,把它作“鮀、魭”的异体淘汰。 ⑷使用新的检索方法。传统的部首检索法,是在部首引导下进行笔画检索。单纯的笔画检索速度太慢,而且由于许多汉字的笔画过于复杂,引起检索困难。 新的检索方法特点是:“以笔顺码检索为主,笔画码检索为辅,实行双码检索”。“笔顺”指汉字部件(不考虑偏旁)的所有笔画的排列顺序,即顺序编号。“笔顺码”指汉字部件(不考虑偏旁)的前三笔画组合的编码(三位编码制)。如“笔”(偏旁:竹)的笔顺码为311,“顺”(偏旁:页)的笔顺码为322。“笔画码”指汉字部件(不考虑偏旁)的笔画总数编码(三位编码制),从000开始。如:“○”的笔画码为000,“一”的笔画码为001,“碘”8画,笔画码为008。 “双码检索”是指在索引引文中,汉字以笔顺码排列,笔顺码相同时以笔画码排列。同时按序号、笔顺码、笔画码、正文页码的排列顺序,在汉字旁边一一标明汉字的顺序号、笔顺码、笔画码和正文页码四项内容,以便在索引和正文中快速查询。将汉字划分为“规范用字”与“参考用字”,实行统一检索,但由于汉字字数繁多,为了不引起必要的麻烦,加快检索速度,参考用字须用括号括起来。 ⒉字典正文的编排方法因汉字书同文后,汉字的各种信息都发生了变化,为了全面反映汉字规范后的全部信息及原有信息的演变,给人们提供正确的参考和指南,正文编排应采用如下方式: ⑴按偏旁归类,以笔画数为序由少到多排列汉字。 ⑵打破传统字典的统一归类方式,实行“规范用字”与“参考用字”分离编排。 ⑶打破传统字典的纯文本编辑方式,采用“16开本表格方式”编辑,表格项目有:顺序号、偏旁、笔画码、笔顺编号、拼音、意义、繁体字、异体字、备注等,汉字演变的来龙去脉都在备注中反映。 如此一来,人们就不会对书同文后的汉字产生迷惑。汉字书同文改革也就成功了。 五 关于汉字规范与书同文的关系汉字的规范化涉及汉字的音、形、义以及偏旁、笔画等诸多层面。汉字的不规范将给计算机信息处理带来很大影响。这里主要结合汉字编码对少部分汉字在字形、笔形、笔画、笔顺方面的不规范化提出在书同文时的改正意见。 ⒈字形的规范化书同文的汉字字形应采用通用印刷体汉字新字形,为适应教学,对部分汉字在宋体与楷体,印刷体与手写体上的差异应进行改正。对下列汉字的字形要重新规范: ⑴身做偏旁时,最后两笔画都应出头,和原字保持同形,以免被误认为是连笔“横折”从而引起笔画数的计算误差。如:射、躬…… ⑵女做左偏旁时,最后一笔“一”要出头,和原字保持同形,以免被误认为最后两笔是连笔“横折”,不但改变书写顺序,而且引起笔画数计算误差。如:好、妙、姐、妹…… ⑶羽做上偏旁时,要带钩,和原字保持同形。目前缺少钩,看起来别扭。如:翼、翠…… ⑷求处于字体上方时要带钩,和原字保持同形。目前缺少钩,看起来别扭得很。如裘……。最好改变“求”、“隶”的笔形,把“氺”写成“水”。 ⑸改变“泰、黍、犀、漆……”的笔形,“氺”向“水”转化。 ⑹改变“杀、寨、亲、条……”的笔形,“朩”向“木”转化。 ⑺从“⺗”底的字尽量向“心”底或“忄”旁转化。 ⑻“寺”应将上面的“土”改成“士”以符合形声字要求,从“寺”的字“侍、恃、诗……”都应更改过来。 ⑼“荆”应写成“上艹下刑”更符合用字规范,“蒯”也一样。 ⑽“年”的下部分应改成“舛”的右部分,以便于草书、行书书写。 ⑾从“广”、从“厂”的汉字,若处于下方的字符属表意字符,“脚最好不要伸得太长”,应注意“界线”。如:“魔、鹰、魇、赝、赓……”,应缩脚。若处于下方的字符不表意,可不必干涉。如:“麼、腐……”(尽管处于下方的字符有的也表意,但不属于130个偏旁之列,保持原形有利于汉字编码)。 ⑿声旁从“莫”偏旁在下的汉字,如“幕、墓、暮……”,容易误认为是偏旁“艹”,在没有冲突的原则下,最好向左偏旁转化。如“幕”转化成“幙”。 ⒀偏旁从“鸟”的汉字,左偏旁的汉字如“鸵、鹱”最好向右偏旁转化,以保持偏旁方位的统一性。 ⒉笔形的规范化汉字的基本笔形有五种:一、丨、丿、丶、乙。笔形“提”可归类于“一”,笔形“捺”可归类于“丶”,几乎没有争议,但笔形“亅”归类于“丨”缺乏理据。 若仅根据少数几个符号如“朩=木”的渊源关系,就推出“亅=丨”,那么根据“巛=川”的渊源,岂不推出“乙=丿”,又“乙=丨”这种错误结论。 根据统一性原则,凡所有的含折、含钩的笔形“横折、竖折、撇折、横钩、竖钩、弯钩……”都归类于“乙”。 ⒊笔画的规范化为了有利于汉字编码及汉字检索,应对下列汉字进行结构调整及笔画调整,在原笔画数基础上增加1画。 ⑴调整“果”的笔画,把“果”归类于偏旁“木”,“果=田+木”,9画。 ⑵调整“禺”的笔画,把“禺”归类于偏旁“田”,写作“”,10画 ⑶调整“制”的笔画,与“告”书写统一。“制=⺧+巾+刂”,9画。 ⑷调整“卑”的笔画,“卑=甶+丿+十”,9画,所有声旁从“卑”的汉字的笔画数都增加1画。 ⒋笔顺的规范化《现代汉语通用字笔顺规范》中的下列汉字的笔顺编号欠妥,须调整: ⑴偏旁为“匚”的汉字的书写顺序,应与偏旁为“冂”汉字的顺序一致,先外后内。“凵”的汉字,先内后外,不作变动。 ⑵万(方、敖)的笔顺153,应为135更合理。“万”的书写顺序应“先丿后乙”。 ⑶巴(眉)的笔顺编号5215,应为5125更合理。“巴”的第二笔画应是“一”而不是“丨”。“巴(眉)”应按“先外后内,再封口”的顺序书写。 ⑷冉(再)的笔顺25211,应为25121更合理。可以理解为“冉=冂+土”,自然“土”的笔顺是“121”,而不是“211”。 ⑸“丑”的笔顺5211理据,应为5121更合理。可以认为“丑=+土”。 ⑹“那”的笔顺511352,应为531152更合理。可以认为“那=刀+二+阝”。 ⑺“重”与“垂”是同形结构的汉字,两者书写顺序应一致。“垂”的书写顺序为“千、艹、二”,“重”应符合“垂”的书写顺序,写成“千、曰、二”。 ⑻“贯”的上部“毌”的笔顺5521,应为5512更合理。中间的部件应是十字架“十”;同理,“毋”的笔顺5531,应为5513更合理,中间的部件应是左字头“”。 ⑼车(牛)不管处于字的哪个部分,其书写顺序一定要统一,车(牛)的笔顺编号统一为1521(3121)。 六 关于汉语拼音方案与书同文的关系汉语拼音方案是否完善,关系到人们能否正确使用汉语拼音,关系到汉字编码能否正确运用汉语拼音,关系到汉语拼音能否顺利向海外推广,以及汉字能否走出国门,走向世界。 ⒈汉语拼音方案的缺陷目前的汉语拼音方案存在美中不足,主要表现在: ⑴声母表中的声母与实际教学不相符。教学中Y、W是声母,而声母表把它们排除在外。 ⑵韵母表中的韵母与实际教学不相符。韵母ueng在实际应用中毫无作用,却在韵母表中占有一席之地,“无功受禄”。韵母er在实际应用中有作为,但天地之大却无其立足之地。 ⑶韵母表框框条条,让人糊涂,不适应对幼小学生教学。 ⒉汉语拼音方案的规范为了适应汉字编码及教学,对汉语拼音方案进行完善: ⑴声母共26个,分为三大类别: 声母:B、P、M、F;D、T、L、N;G、K、H;J、Q、X; Z、C、S;Zh、Ch、Sh、R 准声母:W、Y 虚声母:A、E、O(虚声母用于零声母汉字编码,不应用于教学) ⑵韵母共35个,分为六大音系: a系统:a、ai、ao、an、ang e系统:e、ei、er、en、eng o系统:o、ou、ong i系统:i、ia、ie、iu、in、ian、iao、ing、iang、iong u系统:u、ua、ui、un、uo、uai、uan、uang v系统:v、ve、vn、van ⑶声调符号:为了更好理解古代律诗、绝句的押韵,分为平、仄、轻。 平声:阴平(ˉ)、阳平(') 仄声:阴仄(ˇ)、阳仄(`) 轻声:无声调符号, 几点说明: A删除韵母表的6条说明,声母直接与韵母相拼,韵母ê(ㄝ)向ei转化。 B删除“假洋鬼子”的“儿化”音。如“花儿”拼成huar,不明白还以为是英文。 C由于轻声难以把握,随着语气的不同而不同,规定轻声仅用于偏旁为“口”的句末语气词中。其它汉字,不管是实词还是虚词(包括结构助词),一律带声调。 D中国大陆的专有名称(含少数民族名称)一律采用汉语拼音拼写,废除其它拼写法。如“清华”不能拼成Stinghua。法律面前人人平等,不容许有凌驾法律的特权。 七 关于汉字编码与书同文的关系汉字书同文千万不要忽视了汉字的编码。曾经因为汉字的编码困难,无法进行计算机信息处理,因此,有人便放开喉咙,大声叫嚣:“汉字不亡,中国必亡”。古老而优秀的中华汉字岂能如此遭他人蔑视和侮辱,一腔热血的炎黄子孙,有理由而且有能力让古老而优秀的中华汉字放射出万丈光芒,叫其它文字黯然失色! 书同文与“语同音”及“字同码”三者是密切相关的,语言文字规范约束编码规范,编码规范促进语言文字规范。汉字要走向世界,不能光喊口号,最有效的手段是靠汉字编码来推动。汉字编码既要简单,又要规范,还要实用,否则成效不大。 理论是指导实践的,书同文的改革应需要编码理论的指导。汉字书同文后,最活跃、最直接的应用体现在电脑打字上,没有编码理论的指导,书同文就会争论不休,迷失方向。正确的理论指导正确的实践,错误的理论指导错误的实践。规范的编码会指导书同文走向规范化,不规范的编码只会把书同文引上歪路。书同文也需要编码理论来指导,这需要合理正确地选择编码,编码越规范,就越有发言权。 形码是不能指导书同文的,因为它不考虑汉字读音,只见字拆字,故而发现不了“廬、爐、蘆”简化成“庐、炉、芦”是错误之举。(“瀘、顱、壚、鸕、臚、轤、艣、櫨、鱸”简化成“泸、颅、垆、鸬、胪、轳、舻、栌、鲈”,按照同读lú音的一致类推原则,“廬、爐、蘆”中的“盧”应简化成“卢”而不是“户”。)更无法预料汉字要走向世界,就应对汉字的读音进行规范。 不对汉字偏旁进行规范的音码不能指导书同文,因它无法发现“黽”简化成“黾”,“鼋、鼍”类推简化成“黿、鼉”虽简化很成功,但“黿、鼉”表音、表意功能并不强,而且分辨率极差,并没有给汉字书写及汉字编码带来一丝好处。不如使用表音义功能明显,且对汉字书写及编码都极为有利的“魭、鮀”,废除“黿、鼉”。 不涉及汉语拼音韵母的编码不能指导书同文,因为它无法发现部分汉字存在声、韵搭配上的混乱关系。 不涉及汉字笔顺(笔画)的编码不能指导书同文,因为它无法发现部分汉字在字形、笔形、笔画及笔顺方面存在的不规范,及其给计算机检索带来的不便。 对书同文起指导作用的汉字编码只能是音形码,而且必须是能够全面反映和体现汉字的音、形、义属性的形声双拼式编码。书同文应尽量适合这种汉字的编码规则,应尽可能朝有利于汉字编码的方向发展;要对汉字的字体、字形、拼音、偏旁、笔画、笔顺进行通盘考虑和全面规范;在整理异形字、异体字时,应参考和照顾汉字编码的需要,必要时要舍得忍痛割爱,如舍“麸”取“粰”,废“鼋、鼍、黿、鼉”用“魭、鮀”。 下面探讨该如何运用规范的形声双拼编码理论来指导书同文的改革: ⒈对计算机键盘的改造目前的计算机键盘不但缺点多,而且其杂乱无章的字母布局对汉字编码中的形声双拼编码布局有很大的制约。因此,亟待开发一种符合形声双拼编码布局又兼容现有键盘功能的新型键盘。 ‘ “ | H ong iong | K uang iao | G uai iu | W ua ia | ! 。 | ? , | Y in | J ian | Q ing | X iang | ’ ” | F Ang | M ao | P An | B ai | A a | · . | ~ 、 | E e | D ei | T en | N ie er | L eng | 〈 《 | O uo o | S un vn | C ui ve | Z uan van | … : | — ; | I Zh i | U Ch u | V Sh v | R ou | 〉 》 |
(该图是改变布局后的新键盘的部分键面草图) 新键盘的特点: ⑴键面按汉语拼音的声母b、p、m、f;d、t、n、l……方式对称布局,键位明晰,对初学者极为方便。 ⑵兼容现有键盘的所有功能,对符号的输入更简便。 ⑶巧妙地解决了声母、韵母的对称定位(Zh、Ch、Sh定位在I、U、V键,与Z、C、S对称布局) ⑷科学地解决了130个偏旁的定位(下排键,O键没有定位偏旁,其它键都定位6个偏旁,上排、中排键都定位5个偏旁,偏旁定位整齐。表中未列示) 键盘的改换,不是单纯意义上的布局改换,而是有利于汉语拼音的学习和向海外推广,为汉字走向世界奠定基础。键盘的改换,不妨碍现存的拼音输入法的使用,不影响汉字的信息处理。 在计算机领域,总是别人制订游戏规则,我们来执行,而且已经习惯了。为什么我们不可以制订游戏规则,让外国人来执行?是外国的月亮比中国圆吗? ⒉汉字输入法的编码规范指导书同文的汉字输入法,编码要具备简单、易学、规范、高效等特点,编码要具备通用性能,要适合任何人使用,这就需要编码具备主体输入、辅助输入及检索输入三位一体的功能。 ⑴主体输入法的规范 指导书同文的输入法应能全面反映汉字的音、形、义,以及偏旁、笔画、笔顺等信息。因此,输入法的编码规则是:声母+韵母+偏旁+信息码。由于同音同偏旁的汉字非常少,同音同偏旁又同信息码的汉字更是少之又少,故这一编码规则从理论上成立。 信息码是能够区分和降低汉字重码(同码)的信息符号,作为信息码的首选信息符号有两中:一种是汉字部件的首笔画,有5种类型:横一、竖丨、撇丿、点丶、折乙;另一种是汉语拼音的声调符,也有5种类型:阴平、阳平、阴仄、阳仄、轻声。 信息码选取的不同,所产生的重码(同码)汉字也不同。这两种信息码都很重要,为了做到编码的兼容性,对编码规则做如下调整: 以首笔画为信息码,编码规则:声母+韵母+偏旁+信息码 以声调符为信息码,编码规则:声母+韵母+信息码+偏旁 汉字不能脱离汉语拼音存在,汉语拼音与汉字一样重要。指导书同文的输入法,应该具备编码汉语拼音的功能,以方便汉语拼音读物的出版编辑。 汉语拼音的编码应和汉字的编码兼容,编码规则为:○键+声母+韵母+声调。 ⑵辅助输入法的规范 指导书同文的输入法,编码要具备辅助输入功能。辅助输入法的作用主要在于解决未知读音的汉字的输入问题,以及照顾不懂汉语拼音的人使用等。它主要是采用汉字“分解”方式编码汉字,但不对汉字进行“肢解”,不随意破坏汉字结构的完整性,把汉字拆得七零八落,支离破碎。 辅助输入法应该具备与主体输入法的编码兼容性,应该体现汉字的构造规律及对汉字的感性和理性认识。 这里应用化学上“合成”与“分解”模式,从宏观上来探讨汉字的构造规律及辅助输入法的编码设计,希望引起学者专家们的重视。 A汉字的构造方法:汉字的构造方法也称合成法,分为两种合成模式:单一偏旁合成模式和复合偏旁合成模式。 单一偏旁合成模式(一级合成):由笔画构成部件,再由部件加上偏旁合成单一偏旁汉字。即:笔画→部件,部件+偏旁→单一偏旁字。如: 匪 构造方法:笔画→非(部件),非+匚→匪; 奴 构造方法:笔画→又(部件),又+女→奴。 复合偏旁合成模式(二级合成):由笔画构成部件,由部件加上副偏旁合成单一偏旁汉字,再由单一偏旁汉字加上主偏旁合成复合偏旁汉字。即:笔画→部件,部件+副偏旁→单一偏旁字,单一偏旁字+主偏旁→复合偏旁字。如: 篚 构造方法:笔画→非(部件),非+匚(副偏旁)→匪,匪+竹→篚。 驽 构造方法:笔画→又(部件),又+女(副偏旁)→奴,奴+马→驽。 B汉字的解析方法:解析方法也称分解法,就是对汉字的构造方法进行逆序分解,把汉字分解成偏旁和笔画。相对于汉字的构造方法,汉字的分解模式分为两种:单一偏旁分解模式和复合偏旁分解模式。 单一偏旁分解模式(一级分解):单一偏旁汉字减去偏旁分解为部件,部件拆分为笔画。即:单一偏旁字-偏旁→部件,部件→笔画。如: 匪 解析方法:匪-匚→非(部件),非(部件)→笔画。 奴 解析方法:奴-女→又(部件),又(部件)→笔画。 复合偏旁分解模式(二级分解):复合偏旁汉字减去主偏旁分解为单一偏旁汉字,单一偏旁汉字减去副偏旁分解为部件,部件拆分为笔画。即:复合偏旁字-主偏旁→单一偏旁字,单一偏旁字-副偏旁→部件,部件→笔画。如: 篚 解析方法:篚-竹→匪,匪-匚→非(部件),非(部件)→笔画。 驽 解析方法:驽-马→奴,奴-女→又(部件),又(部件)→笔画。 C辅助输入法编码规则:为使辅助输入法与主体输入法编码完全兼容,设定规则如下: 单一偏旁模式:偏旁+笔画1+笔画2+笔画3(无偏旁的汉字以○键代偏旁)。如: 匪 编码方法:匚+丨+一+一 非 编码方法:○+丨+一+一 复合偏旁模式:主偏旁+副偏旁+笔画1+笔画2。如: 攒 编码方法:扌+贝+丿+一 鸿 编码方法:鸟+氵+一+丨 ⑶检索输入法的规范 指导书同文的汉字输入法,系统要具备检索输入功能和电子字典功能。检索输入法是用来对汉字实行检索和查询,同时也要具备汉字的输入功能。 书同文的各种成果都将写进字典中。但十几亿中国人不可能人人都拥有一本《汉字通典》,也不会去买一本厚厚的《通典》。人人虽不可能拥有却有可能使用电脑,这就需要汉字输入法系统具备字典功能,能提供一种有效查询汉字的方法。因此,书同文时要尽量考虑选用有利于编码检索的汉字作为规范字,若选用不利于编码检索的汉字作规范字,将会给快速检索汉字增加难度。如:指“狡兔”时应淘汰无偏旁的“毚”,选用“犭”旁的“毚”;指“杂毛狗”时应淘汰“尨”,选用“狵”。 任何汉字,无论怎样复杂,都可以分解成“偏旁”和“部件”两部分,部件可分解为笔画。这就为实现计算机编码快速检索汉字提供了有效方法。计算机检索汉字有两种首选方法:笔顺检索法和笔画检索法。 笔顺检索法:采用偏旁和部件的笔顺码检索(四码制),编码规则:偏旁+笔画1+笔画2+笔画3 笔画数检索:采用偏旁和部件的笔画码检索(四码制),也不失为一种检索汉字的有效方法,编码规则:偏旁+笔画码(部件的笔画码从000开始编码)。 ⒊汉字内码字库的制订汉字书同文的同时,要考虑废除目前排列无序的汉字内码字库,制订新内码字库标准。新字库应将汉字分为两类:“规范通用字”与“参考选用字”(繁体字、异体字、方言字、古体字、偏僻字),然后分别对两类汉字以偏旁归类,进行定量、定序排列,制订有序内码。对“规范通用字”可开发各种“输入码”,供人们信息处理用,对“参考选用字”只开发“检索码”,采用检索法输入,不开发输入码,不给人们用字方便,这样,参考选用字既可以使用,但又限制了人们随意乱用。 据悉,国际标准化组织正在制订一个七万字的单一字码编码字符集。在目前汉字书同文还未解决的前提下就匆匆制订一个庞大的编码字符集,并非明智之举。首先,书同文的过程中会有少量新汉字产生,这将打乱字符集的部署;其次,汉字的偏旁归类和排序问题还未统一,杂乱无序的汉字字符集只会给汉字编码带来麻烦。纵观国家制订的各个字符集,没有一个制订得规范合理,国标(GB13000)字符集排序杂乱无章,既不完全按偏旁合理归类,又不完全按笔画合理排序,要查询一个字需费一番工夫。 因此汉字书同文后,应废除各种现行的看似规范实际并不规范的汉字内码字库,制订统一定序的汉字内码字库。 结束语汉字应走简化的道路,这是历史的必然,也是时代的要求,也符合汉字演变发展的内在规律。繁体字很难适合汉字编码及小号字体的分辨显示,倘若古代就有计算机的话,古人也许早就对汉字进行了简化规范,犯不着吾辈再劳心费力。目前,海峡两岸已经清醒地认识到了“一国两字”的存在,给社会发展和社会生活带来的严重影响,因而大谈书同文。但争论的焦点却停留在是“废简从繁”还是“废繁从简”的问题,很少涉及具体细节,更不注重汉字编码的存在,因而争来争去总得不出结果。 “存在的不一定是合理的”,编码规范依赖于文字规范,文字规范应适应编码规范,两者应相辅相成,相互促进,相互发展,不能割裂。“落花有意,流水无情”,不符合文字规范的编码及不符合编码规范的文字,最终要遭到历史的淘汰。 书同文改革的成败,关系到社会生活的方方面面,关系到十几亿人的切身利益,关系到汉字能否走向世界。 繁体字要废除,这是不容争辩的事实;不合理的简化字也要废除,这也是不容置疑的事实;还有一些原先合理存在的字,为了适应汉字编码的需要,在这次书同文运动中也要淘汰出局,这也是不以任何人的意志为转移的事实。社会发展规律就是“物竞天择,适者生存”。 自从1997年12月,周胜鸿先生发起汉字书同文学术研究会以来,已先后举行了五次学术讨论会,有近百位海内外学者专家参加了交流和讨论,取得了一定的研究成果,并得到越来越多的有志之士的关心和支持。 随着北京主办2008年奥运会日期的逐渐来临,大批有志之士在奔走相告、振臂疾呼:力争在2008前实现汉字书同文!2008年太久,似乎还要争论五六年。本文的发表,希望能对汉字书同文的研究起参考作用,加快书同文的进程,结束争议,早日推动汉字走向世界。 主要参考文献⑴冯寿忠《繁简转换的障碍应当清除》,《汉字书同文研究》(第一辑),气象出版社,2001。 ⑵项菊《非对称繁简字整理刍议》,同上。 ⑶冯寿忠《非对称繁简字对照表》(修订稿),同上。 (通讯地址:343100 吉安县城庐陵大道25号 江西省吉安县民政局 ) |