阅读文章

汉字编码的最终归宿

[日期:2009-11-11] 来源:原创  作者:高国鹫 [字体: ]

 

我们生活在汉字文化圈,尽情享受着用汉字描绘出的幸福与快感。但是,到上世纪七十年代末,计算机进入了我们生活中,让人感受到了计算机带来的方便与快捷,同时也感受到了计算机带来的新压力与困惑,至今还在影响着我们的生活,这就是汉字编码(本文指计算机键盘输入方式形码编码)未来走向和归宿问题。

在汉字编码中,把表示汉字的字母、数字及其它符号组合叫汉字码。进入信息时代,汉字码是汉字(通过计算机)与拉丁字母接轨的桥梁:输入的是字母(汉字码),输出的就是汉字。那么汉字码与汉字有哪些共性?未来发展向何方?最终归宿到哪里?

 

  初创阶段

 

造字之初,汉字孕含着浓厚的艺术性,而文字特性并不明显,从目前考古发掘看,到了甲骨文和金文时期,汉字已经发展成一种成熟的文字了。编码之初,汉字码只是汉字的一种辅助工具,别无其它功能。因此,造字之初与编码之初,其汉字与汉字码的文字属性相对都比较弱,这是造字之初与编码之初的共性之一。

造字之初,同一个字有多种描画方法,因此在画演变成字时,汉字就有多种写法,例如在甲骨文中,同一个“羊”字就有几十种不同的写法,可见在造字之初“羊”的写法还会更多。编码之初,各种方案如雨后春笋大量涌现,主要是采用字根或笔画编码两大类,而每一种方法又都能繁衍出其它很多方法。汉字和汉字码的这种多样性,这是造字之初与编码之初的共性之二。

造字之初,受八卦和结绳影响,没有形成完整的造字理论,遵循约定俗成原则,在摸索中一步步前进。编码之初,也没有形成完整的编码理论,也是遵循约定俗成原则,在摸索中一步步走到了今天。无论是最初新造的字还是最初新编的码,都不是最后的定型,它们随时都有被其它新造的字和新编的码所取代,这是造字之初与编码之初的共性之三。

造字之初与编码之初都要经历一个相对漫长时期,如今汉字已经成熟发展三千多年历史了,汉字编码也走完了三十多年历程,但目前仍处于编码之初。

 

  定型阶段

 

编码定型阶段:这是汉字编码发展到一定时期的产物,特征是建立了完善的汉字编码理论,在理论指导下研制出人们普遍能接受的汉字码。汉字码具有排斥功能,因为汉字的二维图形结构注定了自身排序的艰难性,这是困扰汉字几千年遗留的问题,所以汉字码的排斥功能主要体现在对汉字的排序上,没有或排序功能弱的汉字码将面临被淘汰。汉字码发展到这一步具有重要意义:汉字码最终方案将定型,但是,这一时期存在时间将是短暂的,会快速进入到成熟期。目前汉字码距定型阶段尚有一段距离。

造字定型阶段:这是从汉字码定型阶段推测出的,就是在甲骨文和金文之前,也可能存在着一个特殊阶段,在这一阶段形成了完整的造字理论,“依类象形”造字方法逐渐占统治地位,汉字数量聚增并迅速得到推广普及而进入到成熟期,而用其它方法造的字很快被淘汰掉,因此,这一时期是短暂的,甚至没能留下历史记载,而历史遗存物也可能随着时间的流逝和人类文明的发展而毁于一旦。当然这只是猜测,历史是否真的存在着这样一个时期,还是有待于考古发掘来验证。

目前,要有针对性去探索、寻找具有排序功能的汉字码,这对于加快汉字编码历史进程具有重要意义。

 

  成熟阶段

 

甲骨文、金文以后,汉字已经发展成熟,为了推广和巩固自身,汉字沿着常用趋简和约定俗成规律进行演化,目前经过纂文、隶书一直发展至今,汉字在世界文字大家庭中,成为一颗光辉灿烂的明珠。

成熟的汉字码标准可以借鉴汉语拼音成长历程。汉字具有字音和字形,因此汉字编码分为音码和形码,汉字音码在大陆采用汉语拼音,汉语拼音是成熟的,是不能用其它任何标音方法所取代的,是汉字的重要辅助工具,但又不仅仅是汉字的辅助工具,在用汉字表述冗赘时可作为补充,因此具有文字特性,例如在拼写专名、编制型号、代号方面等都表现出文字的特性,只是这种文字特性相对比较弱。

根据等价关系,成熟的汉字形码即汉字码,与汉语拼音一样,除了是汉字的辅助工具之外,也应具有某种文字的特性,这是在用汉字表述冗赘时可作为补充,当然这种文字特征相对也是比较弱的。目前,汉字码距成熟期道路还很漫长。

 

  结论

 

汉字形码即汉字码,是继汉语拼音诞生以来重要的汉字辅助工具,她的历程沿着初创、定型、到不断走向成熟。汉字码未来发展方向是:工具属性在不断弱化,文化属性在不断增强,汉字码的经济价值逐渐转化成文化价值,形成一种新的汉字文化(分支),这是最高阶段的汉字码,无论是计算机字母键盘,还是手机等数字键盘的汉字码,都会沿着这一方向演化,最终归宿是融入汉字文化遗产而载入史册!

 

《汉字拼形系列论文之二十三》

E-mailhzpx8298@yahoo.cn

 

启示:

汉字拼形输入法简介

 

由笔者研发的汉字拼形输入法是按汉字笔顺规则表,一次输入单笔画或多笔画汉字结构,这是除了笔画输入之外唯一的长码方案,最大码长12键,从而确保了大字符集(7万字以上)汉字输入的简单化,因此适宜普及。在实际应用中,汉字拼形主要是挂接到中值码输入法中。

中值码汉字输入法采用通用字(7000字以上)和通用词语(40000余条)编码,取汉字的三个要素:汉语拼音首字母,汉字拼形首、尾字母。在输入中:一键是单字简码;二键是双字词简码;三键是输入汉字;四键是输入词组。

中值码挂接了汉字拼形和汉语拼音。在输入中,凡遇到读不出的字(包括生僻字),只要按U键,进入大字符集字库,采用汉字拼形输入方法;凡遇到写不出的字,只要按V键,进入汉语拼音字库,采用全拼输入法。挂接的输入法只能输入汉字,不能输入词组。

中值码适用于普通用户日常汉字输入,作家、记者、教师等语文工作者文章写作,文字学家、考古工作者古汉语写作,金融、交通、邮政、户籍等部门打字输入,尤其适用于初学或中老年人计算机汉字输入。

中值码汉字输入法分为:中值码G、中值码K、中值码D三个标准,三者之间区别仅仅在于挂接的汉字拼形版本的不同,中值码G挂接的汉字拼形是GB2312(含6763字)、中值码K挂接的汉字拼形是GB13000.1(含20902字)、中值码D挂接的汉字拼形是GB18030-2005(含70244字)。

中值码G汉字输入法近期将作成互联网下载软件,届时欢迎“品尝”。

 

           高国鹫

20091115 

 

 

目前在《语言文字网》(www.yywzw.com)已发表的文章有:

1 《汉字编码三大定律》20071213

2 《笔画组合理论与汉语拼形方案》2008228

3 《数字键盘复码字母键位设定原理》2008229

4 《挑战天下编码人》2008319

5 《汉语拼形汉字输入法》200847

6 《汉字编码——未来推动汉字演化的动力》200866

7 《关于汉字编码第二次整理探讨》200876

8 《论汉字编码数学原理》2008820

9 《汉字编码与密码设置》2008119

10 《汉字编码与互联网域名》20081119

11 《汉字编码与电话号码》20081221

12 《汉字编码与邮政编码》200913

13 《字母异化·数字异化·汉字编码》2009119

14 汉字编码——对汉字简化的“否定”2009217

15 《简化字总表》调整建议方案200988

16 《阿拉伯数字的遗憾》2009530

17 当前汉字编码急需解决的十个问题2009613

18 《〈汉字笔顺规则表〉修改建议方案》2009617

19 《手机互联网输入法》200971

20 《关于“中华姓氏”申报世界非物质文化遗产的倡议》20091023

21 《沉重的〈通用规范汉字表〉》20091025

22 《遭遇汉字编码危机》2009119

23 《汉字编码的最终归宿》20091115

 

近期要发表的文章有:

24 《汉字拼形输入法简介》

 




阅读:
录入:

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:汉字笔画编码方案

下一篇:20+6形符四码检字法简介
相关文章       汉字编码三大定律 
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章