我们生活在汉字文化圈,尽情享受着用汉字描绘出的幸福与快感。但是,到上世纪七十年代末,计算机进入了我们生活中,让人感受到了计算机带来的方便与快捷,同时也感受到了计算机带来的新压力与困惑,至今还在影响着我们的生活,这就是汉字编码(本文指计算机键盘输入方式形码编码)未来走向和归宿问题。
在汉字编码中,把表示汉字的字母、数字及其它符号组合叫汉字码。进入信息时代,汉字码是汉字(通过计算机)与拉丁字母接轨的桥梁:输入的是字母(汉字码),输出的就是汉字。那么汉字码与汉字有哪些共性?未来发展向何方?最终归宿到哪里?
一 初创阶段
造字之初,汉字孕含着浓厚的艺术性,而文字特性并不明显,从目前考古发掘看,到了甲骨文和金文时期,汉字已经发展成一种成熟的文字了。编码之初,汉字码只是汉字的一种辅助工具,别无其它功能。因此,造字之初与编码之初,其汉字与汉字码的文字属性相对都比较弱,这是造字之初与编码之初的共性之一。
造字之初,同一个字有多种描画方法,因此在画演变成字时,汉字就有多种写法,例如在甲骨文中,同一个“羊”字就有几十种不同的写法,可见在造字之初“羊”的写法还会更多。编码之初,各种方案如雨后春笋大量涌现,主要是采用字根或笔画编码两大类,而每一种方法又都能繁衍出其它很多方法。汉字和汉字码的这种多样性,这是造字之初与编码之初的共性之二。
造字之初,受八卦和结绳影响,没有形成完整的造字理论,遵循约定俗成原则,在摸索中一步步前进。编码之初,也没有形成完整的编码理论,也是遵循约定俗成原则,在摸索中一步步走到了今天。无论是最初新造的字还是最初新编的码,都不是最后的定型,它们随时都有被其它新造的字和新编的码所取代,这是造字之初与编码之初的共性之三。
造字之初与编码之初都要经历一个相对漫长时期,如今汉字已经成熟发展三千多年历史了,汉字编码也走完了三十多年历程,但目前仍处于编码之初。
二 定型阶段
编码定型阶段:这是汉字编码发展到一定时期的产物,特征是建立了完善的汉字编码理论,在理论指导下研制出人们普遍能接受的汉字码。汉字码具有排斥功能,因为汉字的二维图形结构注定了自身排序的艰难性,这是困扰汉字几千年遗留的问题,所以汉字码的排斥功能主要体现在对汉字的排序上,没有或排序功能弱的汉字码将面临被淘汰。汉字码发展到这一步具有重要意义:汉字码最终方案将定型,但是,这一时期存在时间将是短暂的,会快速进入到成熟期。目前汉字码距定型阶段尚有一段距离。
造字定型阶段:这是从汉字码定型阶段推测出的,就是在甲骨文和金文之前,也可能存在着一个特殊阶段,在这一阶段形成了完整的造字理论,“依类象形”造字方法逐渐占统治地位,汉字数量聚增并迅速得到推广普及而进入到成熟期,而用其它方法造的字很快被淘汰掉,因此,这一时期是短暂的,甚至没能留下历史记载,而历史遗存物也可能随着时间的流逝和人类文明的发展而毁于一旦。当然这只是猜测,历史是否真的存在着这样一个时期,还是有待于考古发掘来验证。
目前,要有针对性去探索、寻找具有排序功能的汉字码,这对于加快汉字编码历史进程具有重要意义。
三 成熟阶段
甲骨文、金文以后,汉字已经发展成熟,为了推广和巩固自身,汉字沿着常用趋简和约定俗成规律进行演化,目前经过纂文、隶书一直发展至今,汉字在世界文字大家庭中,成为一颗光辉灿烂的明珠。
成熟的汉字码标准可以借鉴汉语拼音成长历程。汉字具有字音和字形,因此汉字编码分为音码和形码,汉字音码在大陆采用汉语拼音,汉语拼音是成熟的,是不能用其它任何标音方法所取代的,是汉字的重要辅助工具,但又不仅仅是汉字的辅助工具,在用汉字表述冗赘时可作为补充,因此具有文字特性,例如在拼写专名、编制型号、代号方面等都表现出文字的特性,只是这种文字特性相对比较弱。
根据等价关系,成熟的汉字形码即汉字码,与汉语拼音一样,除了是汉字的辅助工具之外,也应具有某种文字的特性,这是在用汉字表述冗赘时可作为补充,当然这种文字特征相对也是比较弱的。目前,汉字码距成熟期道路还很漫长。
四 结论
汉字形码即汉字码,是继汉语拼音诞生以来重要的汉字辅助工具,她的历程沿着初创、定型、到不断走向成熟。汉字码未来发展方向是:工具属性在不断弱化,文化属性在不断增强,汉字码的经济价值逐渐转化成文化价值,形成一种新的汉字文化(分支),这是最高阶段的汉字码,无论是计算机字母键盘,还是手机等数字键盘的汉字码,都会沿着这一方向演化,最终归宿是融入汉字文化遗产而载入史册!
《汉字拼形系列论文之二十三》
E-mail:hzpx8298@yahoo.cn
启示:
汉字拼形输入法简介
由笔者研发的汉字拼形输入法是按汉字笔顺规则表,一次输入单笔画或多笔画汉字结构,这是除了笔画输入之外唯一的长码方案,最大码长12键,从而确保了大字符集(7万字以上)汉字输入的简单化,因此适宜普及。在实际应用中,汉字拼形主要是挂接到中值码输入法中。
中值码汉字输入法采用通用字(7000字以上)和通用词语(40000余条)编码,取汉字的三个要素:汉语拼音首字母,汉字拼形首、尾字母。在输入中:一键是单字简码;二键是双字词简码;三键是输入汉字;四键是输入词组。
中值码挂接了汉字拼形和汉语拼音。在输入中,凡遇到读不出的字(包括生僻字),只要按U键,进入大字符集字库,采用汉字拼形输入方法;凡遇到写不出的字,只要按V键,进入汉语拼音字库,采用全拼输入法。挂接的输入法只能输入汉字,不能输入词组。
中值码适用于普通用户日常汉字输入,作家、记者、教师等语文工作者文章写作,文字学家、考古工作者古汉语写作,金融、交通、邮政、户籍等部门打字输入,尤其适用于初学或中老年人计算机汉字输入。
中值码汉字输入法分为:中值码G、中值码K、中值码D三个标准,三者之间区别仅仅在于挂接的汉字拼形版本的不同,中值码G挂接的汉字拼形是GB2312(含6763字)、中值码K挂接的汉字拼形是GB13000.1(含20902字)、中值码D挂接的汉字拼形是GB18030-2005(含70244字)。
中值码G汉字输入法近期将作成互联网下载软件,届时欢迎“品尝”。
高国鹫
2009年11月15日
目前在《语言文字网》(www.yywzw.com)已发表的文章有:
1 《汉字编码三大定律》2007年12月13日
2 《笔画组合理论与汉语拼形方案》2008年2月28日
3 《数字键盘复码字母键位设定原理》2008年2月29日
4 《挑战天下编码人》2008年3月19日
5 《汉语拼形汉字输入法》2008年4月7日
6 《汉字编码——未来推动汉字演化的动力》2008年6月6日
7 《关于汉字编码第二次整理探讨》2008年7月6日
8 《论汉字编码数学原理》2008年8月20日
9 《汉字编码与密码设置》2008年11月9日
10 《汉字编码与互联网域名》2008年11月19日
11 《汉字编码与电话号码》2008年12月21日
12 《汉字编码与邮政编码》2009年1月3日
13 《字母异化·数字异化·汉字编码》2009年1月19日
14 《汉字编码——对汉字简化的“否定”》2009年2月17日
15 《简化字总表》调整建议方案2009年8月8日
16 《阿拉伯数字的遗憾》2009年5月30日
17 《当前汉字编码急需解决的十个问题》2009年6月13日
18 《〈汉字笔顺规则表〉修改建议方案》2009年6月17日
19 《手机互联网输入法》2009年7月1日
20 《关于“中华姓氏”申报世界非物质文化遗产的倡议》2009年10月23日
21 《沉重的〈通用规范汉字表〉》2009年10月25日
22 《遭遇汉字编码危机》2009年11月9日
23 《汉字编码的最终归宿》2009年11月15日
近期要发表的文章有:
24 《汉字拼形输入法简介》