阅读文章

《掌握汉字!》章节精选:汉字信息与电脑

二,字典和排序

[日期:2009-12-28] 来源:语言文字网  作者:邱崇丙 [字体: ]

二,字典和排序

 

把汉字汇集起来,给它注音、释义,以供查询,这就是字典。为了便于检索,就必须有一个目录。这个目录按一定的规则次序来编辑,这就有一个排序的问题。其他的目录索引,甚至一般的名册,表格,也有排序的问题。拼音文字按字母顺序排列,比较简单,汉字就较为复杂一点。有好几种排序的方法。

 

(一)部首

传统的方法是部首排序。先按笔画数目(120画以上),再按笔形(一丨丿丶)排列出部首。每个部首,再按笔画数目和笔形依次排列。清代的《康熙字典》,以及《辞海》、《辞源》,都是用这种方法排序。字的部首很明确,查起字来自然很容易。有些字的部首不太明确,就比较麻烦了。例如:“母”属于什么部首?它跟部首“女”的笔画,已经大不相同,现已并入“毋”部。“每”属于什么部首?又同“母”无关,而归入“丿”部。所以,用部首排序的字典,一般要附“难检字表”。

 

(二)笔画排列

1,笔画数目

用笔画的数目,由少到多依次排列。同一数目的笔画,再按笔形一丨丿丶乛排列。《中国人名大辞典》、《中国古今地名大辞典》,即以笔画由少到多排序。但是汉字的笔画的计数,并没有统一的标准,有些折笔道,算一画还是算两画,带有随意性。而且对所查找的字,先得数清笔画,也颇麻烦。但人名的排列,为了避免分出高低贵贱,常常以笔画多少为序,倒也不失为一种有效的形式。

2,笔形

笔形,即按照一丨丿丶乛顺序排列。

前苏联出版过一部《华俄辞典》,它的排序较为特别。它不管上笔、左笔,只看最后一笔。按最后一笔的笔形一丨丿﹨丶分类,再按最后的部位排序。计有:

,一部(王,止,互,亡,且,山),口部(石,国)。

,丨部(卜,却,十,牛,中,耳),丿丨 部(介,算),(今片),亅部(到,寸),冂(右方笔画)部(司,月,而,巾,再)。

,丿部(少),部(夕),ㄅ(右下方笔画)部(幻,乃,弓,力,母)。

部(人,大,夫,木,禾,火,家,衣,走),部(又,及),乀部(入,之,送,延),\/ 部(氏,戈),乚部(比,龟,七),儿部(元,尤),/  部(气),乙部(乞)。

,丶部(以,小,心,么), 部(,女)。

这种排列方法,可以把声旁部位相同的字排列在一起,如:舀,蹈,韬,稻,滔,也有它的方便处。但中国读者未必习惯。

 

(三)音序

1,注音字母

1918年,民国政府公布了一套汉字注音字母,代替旧用的反切,后改称注音符号。它的用途在于注音识字。共有21个声母,16个韵母。声母依次为:ㄅㄆㄇㄈ,ㄉㄊㄋㄌ,ㄍㄎㄏ,ㄐㄑㄒ,ㄓㄔㄕㄖ,ㄗㄘㄙ。韵母依次为:ㄚㄛㄜㄝ,ㄞㄟㄠㄡ,ㄢㄣㄤㄥㄦ,ㄧㄨㄩ。《国语词典》、《同音字典》曾用它来排序。现在台湾还用这套字母注音,大陆已很少使用。

2,国语罗马字

1928年公布国语罗马字,采用国际通用字母,是一大进步,但实际应用上,并没有推广。

3,汉语拼音方案

1958年,国务院公布了《汉语拼音方案》,用拉丁字母为汉字注音,和拼写词语。不仅是注音,且有向拼音文字过度的性质。字母顺序跟国际上通用的英文字母相同。1982年成为“国际标准”(ISO 7098)。《现代汉语词典》即以此排序。按汉字音节的字母顺序来排序,比部首排序,要容易检索,问题在于必须先知道读音。对于不认识的字,或南方人对读音把握不准确的字,检索起来就有困难。但如果不以识字为目的,对于人名、书名、物品名称等目录,用这种排序来检索,则是很方便的。

 

(四)数码

1,四角号码

把汉字四个角部的笔画编成数字,每个汉字可有四位数字的号码,按数字由少到多排列。即:0头(亠),点横结合。1横(一),包括提挑。2垂(丨,丿,),包括竖、撇。3点(丶,),包括捺。4叉(十,弋,ㄨ,),两笔交叉。5插(扌,丈,丰),一笔纵穿两笔、多笔。6方(口,囗),封闭的四方形。7角(┐,乛,┕ ,┌ ,┘),除四方形外,字的任何一角有横竖相连的笔画。8八(八、人、入,丷),八字及其变形。9小(小 、忄),小字及其变形。其口诀为:横一垂二三点捺,叉四插五方框六,七角八八九是小,点下有横是零头。

由左上角,右上角,左下角,右下角为序,编成四位数。如:端=0212。一笔可以分角取号。如:乙=1771。缺角,或前角已经用过的笔形,用0表示。如:大=4080,产=0020,全=8010。此外还有一些例外和重码的规定。

四角号码不失为一种可行的排序方法,但规则较为繁琐,不容易记忆,往往要现查规则再查字,还容易判断有误。但尝试用数字为汉字编码,是很有意义的,数字化的思路是科学的。

2,上下形检字法

美国编辑过一本《当代汉英词典》,它采用的是上下形检字法。依照字的左上形及右下形分类。笔形概括为33个,分为十类。配以数码,排列成序。其间又将单体字、部首在左上方的字、合体字,分别排列。排序的结果,重码字甚多。查字之前,先要对字作出判断,把两位数拼合成四位数。

把四角压缩为左上右下,把一位数扩展为两位数,虽然也较繁琐,但比四角号码似乎又前进了一步。



上一页 [1] [2] [3] 下一页   
【内容导航】
第1页:一,汉字的现代化
第2页:二,字典和排序
第3页:三,编码与输入法


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:《掌握汉字!》章节精选:注音和拼音

下一篇:易经见闻录
相关文章       《掌握汉字!》 
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章