阅读文章

周南祥:汉字书同文与汉字新排序

[日期:2013-02-26] 来源:语言文字网  作者:周南祥 [字体: ]

文字为了检索方便都需要排序。文字有形有音,形数量多,音数量少。按形排序,数量多,排序复杂,难以学习掌握,按音排序,数量少,排序简单,易于学习掌握。故世界上大多数文字都按音排序。
湘潭市工业贸易中等专业学校/工贸学校/工贸中专/市一职招生简章

湘潭市工贸学校2019年招生简章(每年更新)

表音文字数量极少,排序法比较简单,几十个字按音排序即成字表--字母表,词典即根据字母表顺序排列词序。表音文字本身就是一种表音符号,即音符,按音排序就是按音符排序。一般只编写字表,不需要编写字典。

表义文字数量极多,排序法比较复杂。汉字是表义文字,数万汉字可以按字形、字义、字音排字序,而且无论按字形,还是按字义、字音排序,都有许多种排序法,既编写字表,也编写字典。词典根据字表、字典顺序排词序。汉字不是表音符号,汉字与汉字音符很多是不等同的。汉字音符又比较复杂,因此虽然汉字在现代也出现按音排序的字表、字典,但是至今只出现按整字拼音排序的字表、字典,还没有出现按音符排序的字表、字典。

目前常用的汉字排序法有部首笔数排序法、笔数笔形排序法、笔形编码排序法、形音编码排序法、整字拼音排序法。这些排序法都有不少缺点。看到一个字,人们最先想知道的是字音,然后是字义。记得一个字形以后,人们最先想记得的是字音,然后是字义。因此,人们特别需要知道字与字在音方面的联系,特别需要知道识读和记忆字音的规律。上述排序法不能充分显示字与字之间在音方面的联系与规律,使数万汉字从字音上看像是一盘散沙,而且有些排序法要记许多规则,使用起来也很不方便。

部首笔数排序法,把汉字的一部分(意符或音符或笔画)作为部首,先按部首笔数多寡再按剩余笔数多寡排序,笔数相同时按笔形序(丶一丨丿乛或一丨丿丶乛)排序。部首位置可在字左部或字右部或字上部或字下部或字外围或字中部或左上部。如(1)丶部:义、丫、丸、之、为、头、主、半、州、农、良、举、判、爲,(2)一部,一画:一,一画至二画:七、丁、三、千、于、下、上、丈、兀、万、与、才,三画:丰、天、夫、开、井、无、专、丐、不、卅、冇、丑、屯、互、牙。

笔数笔形排序法,先按组成汉字的笔数多寡再按起笔笔形排序。笔数相同时按笔形序排序,笔形序依次分为一、丨、丿、丶、乛及其复合形式一一、一丨、一丿、一、、一乛等等。如一画:一、乙,二画,一部:二、十、厂、丁、七,丨部:卜,丿部:八、人、入、乂、匕、儿、几、九、乃,乛部:刁、刀、力、又、厶、了、乜。

笔形编码排序法,把笔形编成号码,取汉字各个(個)位置的笔形号码组成数字或字母,按数字大小顺序和字母顺序排序,取码方法又有多种:

依汉字左上角、右上角、左下角、右下角顺序取的笔形号码称四角号码(1、2、3、4、5、6、7、8、9、0分别代表横、竖、点、叉、串、方、角、八、小、头,同码字取右下角上方一个笔形作附号,即第5号),如弯0002-7、主0010-4、童0010-5、亶0010-6、立0010-8、銮0010-9、症0011-1。

依汉字上边、右边、下边顺序取的笔形代码称三边号码(1、2、3、4、5、6、7、8、9、0分别代表横、竖、撇、点、折、一交叉、二交叉、八字形、端点相接形、口形),如乙5、止2211、新4918、语4110、算8807、摔2446。

取汉字起笔的笔形代码称起笔号码。

取汉字尾笔的笔形代码称尾笔号码。

取汉字第一笔和第二笔的笔形代码称前二笔号码。

取汉字第一、第二笔和尾笔的笔形代码称为头尾三笔号码(1、2、3、4、5、6、7、8、9、10、11分别代表横、竖、折等等),如三111、涨858。

取汉字前三笔的笔形代码称前三笔号码(1、2、3、4、5、6、7分别指横、竖、撇、点、顺折、反折、方匡),如元113、丫432、乂430、厂130、阝520、几350、又540。

取汉字前四笔的笔形代码称前四笔号码。

笔形用笔形名称的拼音字母首字母表示,每种笔形的笔数用数字表示的称为笔形笔数号码,横为H,丨为s,丿为p,点为D,乛为z,如“丶”的笔形号码为D,笔形数是2笔,即标为D2,“大”字编为h1s1d1。

笔形编码排序法中比较流行的是四角号码排序法,其他排序法只有少数人使用。

形音编码排序法,以拉丁字母作为汉字首、尾部件和字音的代码,部件象什么字母即用什么字母代表部件,以字音的首音字母代表字音,如“合”,首笔像A,尾笔像O,字音首字母是H,此字编码就是AOH。

部首笔数排序法的优点是很多部首相当于汉字意符,部首排序相当于按意符排序,只要会数笔画,熟悉笔顺,就可检索汉字,便于查检不知读音的生字,缺点是部首的位置不固定,有些字难以确定部首,同笔画的部首字及同部首内的字,排列次序会有多种,同一字的繁简异形排在不同位置,不合理,笔数要反复数,比较繁琐,容易数错,有些字的笔顺难以确定,影响查字速度。

笔数笔形排序法的优点是只要会数笔画,熟悉笔顺,就可检索汉字,缺点是数笔画比较繁琐,笔数相同的字排序时会有多种,有些字或者部件的笔顺有不同排法,影响正确排序,笔数和笔顺都相同的字的排序会有多种。

笔形编码排序法的优点是可以直接根据笔形编码查字,避免了数笔画的繁琐,采用阿拉伯数字或拉丁字母编码,查找起来比较方便,缺点是规则比较复杂,初学者不易掌握,重码字较多,需要增加区别码。

形音编码排序法的优点是可以直接根据直觉象形和字音查字,避免了数笔画的繁琐,缺点是字或部件象什么字母难以确定。

无论部首笔数排序法、笔数笔形排序法、笔形编码排序法还是形音编码排序法主要都是根据字形排序,说明历来人们较重视汉字字形方面的规律,重视表义规律,不太重视字音方面的规律。古代有过韵书,按汉字音韵排序,但只用于诗歌音韵,没有普遍使用。

世界上多数文字都是按音排序的,只有汉字历来偏重按笔形、笔数排序。按笔形、笔数排序,要辩笔形,数笔画,记规则,麻烦较多。按音排序,只要记住表示字音的字母表即可(字母表是进过小学的人都熟悉的),异常简便。故而,汉语拼音方案出现以后,汉字也开始按音排序,但主要使用整字拼音排序法。

整字拼音排序法,按汉字拼音的字母顺序排列音节(先按首字母,再按次字母,余类推),同音节汉字按声调1、2、3、4声的顺序排列汉字,如a音节:ā阿啊(呵)锕腌,á嗄啊(呵),ǎ啊(呵),à啊(呵),a啊(阿、呵),ai音节:āi哀锿哎(噯)埃挨唉欸娭,ái癌皑(皚)挨(捱)騃,ǎi霭蔼毐嗳(噯)矮欸,ài嗌隘(戹)阸艾砹硋碍(礙)唉爱(愛)瑷(璦)叆(靉)薆嗳(噯)暧(曖)嫒(嬡)。

整字拼音排序法的优点是只要知道字的读音,会拼音就能迅速排检汉字,准确率高,不受简、繁字形的影响,符合国际上大都按音序检索的习惯,缺点是读不出或读不准音的字难以排检,同音字的排序会有多种。这种排序法虽然注意按汉字字音排序,但并没有注意字与字在音方面的联系和规律,同音节同音符汉字处于分散状态。因此,需要发展和改进,进一步探索按音排序的新方法。

从汉字实际看,大部分汉字是义音字,通过音符表音,很多非义音字本身充当音符(只有极少汉字不能充当音符又缺少明确的音符)。根据汉字表音规律,汉字也完全可以按音符排序。

汉字音符排序法,先按汉字音符的拼音字母顺序排列音节序,同音节按音符笔数多寡从少到多顺序排列音符序,同音符汉字按意符笔数多寡从少到多顺序排列字序,其余孤字(没有第二个同音符字的汉字)按汉字笔数多寡从少到多顺序排序。例如A、Ai两音节的汉字可排序如下(音符和散字后面的数字表示笔画数):A  5-呵阿啊锕   孤字:吖6腌12嗄13   Ai  厄4-伌阨  戹5-阸呝  5-艾哎砹    5-矣唉埃挨娭欸騃疑懝礙譺  厓8-啀捱娾崖嘊  委8-矮躷  9-哀锿  9-堨餲馤蔼霭藹靄譪  豈10-凒溰嵦隑敱敳磑皚  10-隘嗌塧賹  10-爱嗳嫒瑷叆暧  14-愛僾噯嬡瑷璦靉暧曖薆  孤字:毐7111113噫16癌17(破折号前为音符,破折号后为以该音符为统帅的系列汉字)。汉字书同文和完善化后,孤字全部纳入音符系统。

汉字音符排序法兼有整字拼音排序法的优点,只要知道字的读音,会拼音会数笔画就会查字,速度快,准确率高,符合国际上大都按音序检索的习惯,至于读不出或读不准音的字难以查找的缺陷可附以笔形笔数排序法解决。这种排序法可以避免整字拼音排序法同音字的排序会有多种的缺陷,因为同音字,虽然字音相同,但是如果音符相同,义符不会相同,如果义符相同,音符不会相同,因此同音字的排序可以固定为一种。这种排序法还具有整字拼音排序法所没有的优点:根据拼音可以很容易地查到音符(因为音符数量比汉字数量少得多),查到音符即可以很容易地查到汉字(查到音符后只要数意符笔画,意符笔画比整字笔画少得多)。

在汉字没有书同文和完善化之前,按音符拼音排检,还有不少不便:音符有简形、繁形,不统一,同音音符过多,同形音符也过多,多音字过多造成一字多排等等。因此,要使汉字音符拼音排序法真正科学实用,必须实现汉字书同文和汉字完善化。

汉字实现书同文并且完善化后,汉字字形的统一和完善,将促使义符、音符的统一和完善,音符排序法,将发挥更大的作用,为汉字学习者带来更多便利。如果实现书同文和完善化,繁简字统一,简形音符、繁形音符,如“爱\愛”“岂\豈”,将合而为一,互为异形的音符,如“厄\戹”,也合而为一,互为异形的字如“礙\碍\硋”的音符也合而为一(定一字为正字,其余异形字都置于括号内备考),其他音符也进行筛选归并,异形同音音符尽量同化,孤字的音符与同音节音符同化,异音同形音符尽量异化,音符将更加精干,易记,音符排序将更为完善有效。

现在汉字尚未书同文,尚未完善化,我们只能从汉字中抽取相当于声旁的部分权作音符或类音符。这只能算不完善的音符。完善的音符应该一符一形,一符一音,需要大众讨论专家研究政府审定。

现将以“A”“B”为拼音首字母的部分汉字按音符排序法进行排序,制成字表作为样品附录于后,有兴趣的研究者可以将所有8万多汉字都按音符排序。此字表的所有汉字按音符拼音的音节顺序排列,以音符所在音节的音作为音符的音。音符置于破折号前,以该音符为统帅的系列汉字(包括零意符的汉字)排列破折号后(不论是否属于同一字种)。非意音字、部分意音字和音符不明确的汉字暂以共同部件作为类音符(有些字的音符与《说文解字》所划分的声旁不尽相同),没有成字的音符用汉字去除或加添一些笔画或部件表示,以括号注明,没有共同音符的汉字作为孤字,同形字符叠加的汉字不拆分音符、意符。在音符尚未整治前,由于同音异形音符未曾归并,异音同形音符未曾别异,一符多音、一音多符现象较为严重,排序表使用价值尚小,因此,系列汉字和孤字除“A”“Ai”两音节外都暂不进行正式排序。异形字不管有没有经过整理,都排入字表,可以更多了解汉字的音符系统。



[1] [2] 下一页   


阅读:
录入:周南祥

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:大众灯语-2(试行)

下一篇:一种手机汉语拼音键盘——1agb键盘
相关文章       周南祥 
本文评论
  中国新拼是对汉字和汉语统一编码,可以在1-3码范畴内表达全部汉字和汉语的标准读音和口语声音而不必另加声调符号;新拼矩阵形成三维立体纵横多向智能有声编码结构,可以将全部汉字和汉语进行有序排列,并可以新拼数学公式进行推导和运算,从而准确反映任何语言文字在时间和空间中的确切位置。欢迎切磋交流!   (曲振兴 ,2013-09-17 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章