二,字典和排序
把汉字汇集起来,给它注音、释义,以供查询,这就是字典。为了便于检索,就必须有一个目录。这个目录按一定的规则次序来编辑,这就有一个排序的问题。其他的目录索引,甚至一般的名册,表格,也有排序的问题。拼音文字按字母顺序排列,比较简单,汉字就较为复杂一点。有好几种排序的方法。
(一)部首
传统的方法是部首排序。先按笔画数目(1-20画以上),再按笔形(一丨丿丶乛)排列出部首。每个部首,再按笔画数目和笔形依次排列。清代的《康熙字典》,以及《辞海》、《辞源》,都是用这种方法排序。字的部首很明确,查起字来自然很容易。有些字的部首不太明确,就比较麻烦了。例如:“母”属于什么部首?它跟部首“女”的笔画,已经大不相同,现已并入“毋”部。“每”属于什么部首?又同“母”无关,而归入“丿”部。所以,用部首排序的字典,一般要附“难检字表”。
(二)笔画排列
1,笔画数目
用笔画的数目,由少到多依次排列。同一数目的笔画,再按笔形一丨丿丶乛排列。《中国人名大辞典》、《中国古今地名大辞典》,即以笔画由少到多排序。但是汉字的笔画的计数,并没有统一的标准,有些折笔道,算一画还是算两画,带有随意性。而且对所查找的字,先得数清笔画,也颇麻烦。但人名的排列,为了避免分出高低贵贱,常常以笔画多少为序,倒也不失为一种有效的形式。
2,笔形
笔形,即按照一丨丿丶乛顺序排列。
前苏联出版过一部《华俄辞典》,它的排序较为特别。它不管上笔、左笔,只看最后一笔。按最后一笔的笔形一丨丿﹨丶分类,再按最后的部位排序。计有:
Ⅰ,一部(王,止,互,亡,且,山),口部(石,国)。
Ⅱ,丨部(卜,却,十,牛,中,耳),丿丨 部(介,算),┐部(今片),亅部(到,寸),冂(右方笔画)部(司,月,而,巾,再)。
Ⅲ,丿部(少),フ部(夕),ㄅ(右下方笔画)部(幻,乃,弓,力,母)。
Ⅳ,﹨部(人,大,夫,木,禾,火,家,衣,走),乂部(又,及),乀部(入,之,送,延),\/ 部(氏,戈),乚部(比,龟,七),儿部(元,尤),乁/ 部(气),乙部(乞)。
Ⅴ,丶部(以,小,心,么),ㄑ 部(巜,女)。
这种排列方法,可以把声旁部位相同的字排列在一起,如:舀,蹈,韬,稻,滔,也有它的方便处。但中国读者未必习惯。
(三)音序
1,注音字母
1918年,民国政府公布了一套汉字注音字母,代替旧用的反切,后改称注音符号。它的用途在于注音识字。共有21个声母,16个韵母。声母依次为:ㄅㄆㄇㄈ,ㄉㄊㄋㄌ,ㄍㄎㄏ,ㄐㄑㄒ,ㄓㄔㄕㄖ,ㄗㄘㄙ。韵母依次为:ㄚㄛㄜㄝ,ㄞㄟㄠㄡ,ㄢㄣㄤㄥㄦ,ㄧㄨㄩ。《国语词典》、《同音字典》曾用它来排序。现在台湾还用这套字母注音,大陆已很少使用。
2,国语罗马字
1928年公布国语罗马字,采用国际通用字母,是一大进步,但实际应用上,并没有推广。
3,汉语拼音方案
1958年,国务院公布了《汉语拼音方案》,用拉丁字母为汉字注音,和拼写词语。不仅是注音,且有向拼音文字过度的性质。字母顺序跟国际上通用的英文字母相同。1982年成为“国际标准”(ISO 7098)。《现代汉语词典》即以此排序。按汉字音节的字母顺序来排序,比部首排序,要容易检索,问题在于必须先知道读音。对于不认识的字,或南方人对读音把握不准确的字,检索起来就有困难。但如果不以识字为目的,对于人名、书名、物品名称等目录,用这种排序来检索,则是很方便的。
(四)数码
1,四角号码
把汉字四个角部的笔画编成数字,每个汉字可有四位数字的号码,按数字由少到多排列。即:0头(亠),点横结合。1横(一),包括提挑。2垂(丨,丿,亅),包括竖、撇。3点(丶,﹨),包括捺。4叉(十,弋,ㄨ,),两笔交叉。5插(扌,丈,丰),一笔纵穿两笔、多笔。6方(口,囗),封闭的四方形。7角(┐,乛,┕ ,┌ ,┘),除四方形外,字的任何一角有横竖相连的笔画。8八(八、人、入,丷),八字及其变形。9小(小 、⺌,忄),小字及其变形。其口诀为:横一垂二三点捺,叉四插五方框六,七角八八九是小,点下有横是零头。
由左上角,右上角,左下角,右下角为序,编成四位数。如:端=0212。一笔可以分角取号。如:乙=1771。缺角,或前角已经用过的笔形,用0表示。如:大=4080,产=0020,全=8010。此外还有一些例外和重码的规定。
四角号码不失为一种可行的排序方法,但规则较为繁琐,不容易记忆,往往要现查规则再查字,还容易判断有误。但尝试用数字为汉字编码,是很有意义的,数字化的思路是科学的。
2,上下形检字法
美国编辑过一本《当代汉英词典》,它采用的是上下形检字法。依照字的左上形及右下形分类。笔形概括为33个,分为十类。配以数码,排列成序。其间又将单体字、部首在左上方的字、合体字,分别排列。排序的结果,重码字甚多。查字之前,先要对字作出判断,把两位数拼合成四位数。
把四角压缩为左上右下,把一位数扩展为两位数,虽然也较繁琐,但比四角号码似乎又前进了一步。