阅读文章

字母异化*数字异化*汉字编码

[日期:2009-01-19] 来源:语言文字网  作者:高国鹫 [字体: ]

 

一、前言

什么是异化,相似或相同的事务逐渐变得不相似或不相同起来叫异化。异化是打乱了原有节奏,在发展过程中受某种“刺激”而产生的一种跳跃,甚至脱离了原有的轨迹,在自然界,异化产生了新物种,在自然科学界,异化推动了生产力发展,在人类进化史,异化创造了文明……

在人类文明演化进程中,文字的产生与图画艺术变异密不可分的,在世界最古老的四个文字发源地,无论是产生于中东的苏美尔文字、产生于埃及的古埃及文字、产生于墨西哥的马亚文字、产生于中国的汉字,都是图画异化的结果,只是地域、人种、生活习俗、异化时间的不同,从而演化成不同的文字。

在汉字演化过程中,为了融入不同文化,往往也采用异化来达到与国际接轨目的,用外来文化为我服务,这里最重要的首推字母异化,其次是数字异化,字母和数字异化的结果不但丰富了汉字文化内涵,也推动了汉字文化发展。

 

二、字母异化在汉字文化演化中的作用

1、字母异化在汉语中应用

汉字抛开本来构词功能,借用其形状来描述和指称客观事物叫汉字异化,例如形状像“丁”字的尺叫“丁字尺”,断面像“工”字的钢叫“工字钢”等,用这种方法描述客观事物既简单方便,又形象好记,能够达到见其字如见其物的效果。

借用汉字异化来描述和指称客观事物是文字表达功能的延伸,这在语言文字中得到了广泛应用。但是,因为汉字笔画多,有时很难用一个简单的字来描述,例如象“蛇”一样弯曲的道路,如果用“蛇”做道路标志牌,车要走很近才能看得清,因此安全警示作用比较差;如果事物比较复杂,往往又很难找到恰当的汉字“形”来描述,所以借用汉字异化来描述和指称客观事物具有局限性。

人们对字母是很熟识的,有时用字母的形状来描述和指称客观事物却很方便:字母抛开本来拼词功能,借用其形状来描述和指称客观事物,从而达到见其字如见其物的效果,这就是字母异化,字母异化是文字表达功能的再延伸。例如“蛇”形路如果用字母S来描述并制成道路标志牌,车在很远处就能发现,安全警示作用就比用汉字“蛇”做标志牌强得多,因此得到司机和交通部门的普遍认可,像这样用字母描述物体形状的还有U形管,T恤衫等。

在汉语中通常把“S形弯”、“U形管”、“T恤衫”等用字母构成的词称之为字母词,这是汉语的重要组成部分,当然,字母词不仅仅用于描述事物的形状,像“BP机”、“卡拉OK”、“γ射线”、“IP电话”、“WTO”等都是字母词,随着中国在更多领域与世界接轨,未来汉语会接纳更多的字母词,汉语中融入字母词丰富了汉语内涵。

2、汉语拼音与字母异化

汉字具有形、音、义三要素,字母异化能否用来描述汉字,为汉字服务呢?答案是肯定的,字母异化用于描述汉字音的就是拉丁字母《汉语拼音方案》。

汉字音与拉丁字母是没有渊源关系的,《汉语拼音方案》采用拉丁字母给汉字注音,这是字母脱离了原本拼词功能,借用字母名称(读音)来描述和指称汉字,因此说《汉语拼音方案》是拉丁字母异化的结晶,这在五十年前就已经解决了。

在五十年前公布《汉语拼音方案》时是一种近似音,字母名称采用注音字母标音,直到1982在《汉语拼音字母名称读音对照表》中,汉语拼音字母名称开始用汉语拼音、注音字母、国际音标三种方法标音。

《汉语拼音方案》采用拉丁字母异化为汉语服务,除了能标音之外,在汉字按音序排序、标准化管理、信息处理等许多领域都得到了广泛应用,现已发展成为拼写汉语的国际标准,是人们不可缺的汉字辅助工具,为汉字演化史留下了光辉灿烂的一页,正如周有光先生所说:“它一方面方便人民大众走向文化,另一方面方便中国文化走向世界”。

3、汉语拼形与字母异化

在汉字形、音、义三要素中,用字母异化来描述汉字音的是拉丁字母《汉语拼音方案》,人们自然会联想到,字母异化能否用来描述汉字形呢?答案也是肯定的,字母异化用来描述汉字形的就是拉丁字母《汉语拼形方案》。

汉字形与拉丁字母也是没有渊源关系的,《汉语拼形方案》采用拉丁字母给汉字标形,这是字母脱离了原本拼词功能,借用字母形状来描述和指称汉字,因此说《汉语拼形方案》也是拉丁字母异化的结晶。

《汉语拼形方案》采用拉丁字母标形是一种近似形,字母异化(近形)对照表见表1(略,详见《汉语拼形汉字输入法》一文),下面举几组实例:

一廿艹廾卅——用字母H近似表示;

小川巛——用字母N近似表示,想象中把字母N从折点处断开就有相似点了;

冂凵冖——用字母U近似表示;

人入八儿——用字母V近似表示;

十巾屮——用字母X近似表示;

这种“近形”表示方法虽然不尽相同,有的朝向甚至完全相反,但还是能够悟出共性,这是人们容易接受《汉语拼形方案》的基础。

有人问与字母对应能否产生歧义性,例如“亻”是与T相近还是与J相近呢?在统计重码时,为减少重码规定“亻”用字母J表示,这属于约定俗成。

还有人问汉字成千上万,这么多字怎能与字母形状作一对一的比较?是的,这样比较是过于牵强附会,但是,如果把汉字析出的、由笔画组成的汉字构件与字母的形状作一对一的比较,实践证明是可行的。

例如“木”字,很难找到与哪个字母在字形上相近,但按笔序“木”能析出“一小”或“十人”,前面已经知道,“一”用H表示,“小”用N表示,“十”用X表示,“人”用V表示,这样“木”就有HNXV两种编码,这是一对重码,在字母排序中,X位于H后面,因此规定“木”用字母组合XV表示,采用字母排列顺序来调整汉字编码的歧义性问题,这是《汉语拼形方案》独有的。

怎样理解把“木”析出“十人”呢?如果说是拆分出来的,会遭抵制,因为依据“字源”汉字“木”是不能再拆分的,因此,“木”要采用多字母编码这在汉字“拆分”理论下是行不通的,说明汉字“拆分”编码理论具有局限性。

这里采用笔画“组合”理论,这是一种新型汉字编码理论(见《笔画组合理论与汉语拼形方案》一文),依据《汉字笔顺规则表》,这是从上小学时开始学习的,因此汉字编码采用“笔顺规则表”要比采用“字源”简单容易得多。

在《汉语拼形方案》中“木”是这样编码的:按照笔顺由笔画组合成“十、人”,再由“十、人”组合成“木”,从这里可以看出,《汉语拼形方案》构件相应要少得多,因为采用“近形”编码,只要记住一个构件与字母的对应关系,这一组构件与字母的对应关系也都记住了。

在汉字编码中,还可以绕开汉字编码过程,直接用拉丁字母给汉字起名称:按约定俗成,汉字有两个拉丁字母名称,按字音起的名叫汉语拼音,按字形起的名叫汉语拼形,例如“木”汉语拼音是MU,无论汉字的输入、排序、国际交往,“木”的字音名称终生都叫MU;同样道理,“木”汉语拼形是XV,无论汉字的输入、排序、国际交往,“木”的字形名称终生都叫XV

4、汉语拼音与汉语拼形之间关系

周有光先生指出,《汉语拼音方案》有三个原则:(1)口语化,(2)音素化,(3)拉丁化。同时指出它有三个“不是”:(1)它不是汉字的拼形方案,而是汉语的拼音方案;(2)它不是方言的拼音方案,而是普通话的拼音方案;(3)它不是文言的拼音方案,而是白话的拼音方案。

从周先生的三个原则可以看出,汉语拼音的拉丁化特性,说明能够走遍天下,事实也确实如此,目前汉语拼音已经成为连接中国大陆与世界的文化桥梁。

从周先生的三个“不是”也能看出,汉语拼音是缺失“形”的汉字,说明它不能走进历史,另外,根据汉语拼音的口语化特点,人们日常口语用字大约四、五千字,再扩大范围也就六、七千字左右,对应现代汉语通用字表(含7000字),吕叔湘先生说《汉语拼音方案》是最佳方案也是指在这一范围,对于超过通用字范围的字符集,汉语拼音优势锐减。

《汉语拼形方案》也有三个原则:(!)书面语言,(2)由笔画拼成构件,(3)拉丁化。同时它有三个“是”:(1)是汉字的拼形方案,(2)是方言的拼形方案,(3)是文言的拼形方案。从这里可以看出,汉语拼形是缺失“音”的汉字,说明它能够走进历史,它的拉丁化特性,说明它也方便不同文字国家的学者走进中国历史。

根据汉字形、音、义三要素,汉语拼音缺失字形,汉语拼形缺失字音,所以它们都不能取代汉字,只是汉字的辅助工具,是拉丁化的汉字辅助工具,并且这两种辅助工具有互补性,这预示着在未来汉字输入中,只有汉语拼音与汉语拼形联手发展,才能最终解决汉字编码问题。

 

三、数字异化在汉字文化演化中的作用

数字有形状,可以借用数字的形状来描述和指称客观事物;数字也有名称,也可以借用数字的名称(读音)来描述和指称客观事物。数字抛开本来表示量的涵义,借用其形状或名称(读音)来描述和指称客观事物,从而达到预期的效果,这是数字的异化作用,是人们积极利用数字的表现,是数字表达功能的延伸。

1、数字异化在日常生活中的应用

首先出一道智力测验题:一老者起大早到河边钓鱼,傍晚回家,老伴问钓了几条鱼,老者说:钓6条没头的,8条半截的,9条没尾的,老伴想了半天也没弄清钓了几条鱼,那么到底钓了几条鱼呢?其实一条也没钓到,如果按数字的字形,把数字6截掉头,数字8截一半,数字9截掉尾,剩下的部分都像数字0,所以一条也没钓到,这是一道用数字异化(按字形)出的智力测验题。

在网络语言中,也有很多数字异化构成的语言:

按字形构成的网语有

001000                                           我很孤独

0002000                                          驼背孤寡老人

按读音构成的网语有

0456                                             你是我的

1314                                             一生一世

7456                                             气死我了

8384                                             不三不四

人们对数字0——9喜好的程度是不同的,如果按期望值排队,通常按数字名称(读音),因为8与“发”谐音而排在榜首;6寓意“六六大顺”排在第二位;9寓意“天长地久”排在第三位;因为4与“死”谐音而排在最末,在下面数字异化中,把每个数字都用一个汉字标识,并按人们期望值大小排列顺序是:8(发)、6(顺)、9(久)、2(爱)、3(想)、0(你)、5(我)、1(一)、7(气)、4(死)。

在乐普中,简普基本音级用阿拉伯数字1234567表示,读音用“多、来、米、发、梭、拉、西”标注,这里数字异化与数字的形和音都无关,属另类异化,这是给数字赋予全新的涵义,当然这也可用字母abcdefg表示,或用Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ表示,或用甲、乙、丙、丁、戊、已、庚表示等,并赋予相应读音,其实在民间也有很多用不同符号表示的方法,所有这些,只有阿拉伯数字全世界通用,而且从幼儿时起就接受这种数字启蒙教育,因此简普选择阿拉伯数字是最适宜的,这种数字只有7个,赋予新的音乐名称人们也容易接受,目前用阿拉伯数字表示的简普已经成为汉字文化的重要组成部分。

2、数字异化在汉字编码中的应用

在字母异化中,汉语拼音和汉语拼形是汉字的辅助工具,下面介绍在数字异化中,通过复码数字键盘,汉语拼音和汉语拼形能够转化成数字汉语拼音和数字汉语拼形,这也是汉字的辅助工具,不仅如此,复码数字键盘也能把英文转化成数字英文,数字英文是英文的辅助工具。

拉丁字母与阿拉伯数字是没有渊源关系的,复码数字键盘通过采用阿拉伯数字给拉丁字母标形,这是数字脱离了原本表示量的涵义,借用数字形状来描述和指称字母,因此说这是阿拉伯数字异化的结晶。

这种方法原理是:数字异化能够表示字母,字母异化能够表示汉字,因此,数字异化也能够表示汉字,对于英文来说,直接用数字异化来表示英文就可以了,这比用数字异化来表示汉字少一个转化过程,因此使用更为简单方便。

数字异化(近形)对照表见表2

 

数字异化(近形)对照表               2

     

 

  字  

                        

        0

 

DOR

DO直接,R两腿长可以“蹲下”

        1

 

 IJL

IJL直接

        2

 

  NZ

N旋转90度,Z直接

        3

  EMW

E旋转180度,M旋转90度,W逆旋转90

        4

  AK

4有封闭三角形,A有封闭三角形,K首笔向右移也可形成封闭三角形

        5

 

   ST

S直接,T首笔右移末笔成半园

        6

 

  CG

CG笔序走势一致

        7

 

 UVY

UVY逆旋转90度,开口朝向一致

        8

 

 BHX

B直接,HX上端及下端封闭

        9

 

 FPQ

FP Q上部大

 

2是通过数字异化寻求与字母在字形上相近关系,从而达到用数字表示字母目的,具体应用见表3,这是一种数字键盘——复码数字键盘,可用于手机等数字键盘产品。

 

        复码数字键盘字母键位设定              3

 

1

 

        I   J   L

 

             2

 

          N    Z

 

         3

 

       E   M   W

 

4

 

        A    K

 

            5

 

           T

 

6

 

           G

 

7

 

       U  V  Y

 

8

 

        B  H  X

 

              9

 

        F   P  Q

 

 

            0

 

        D  O  R

 

 

3复码数字键盘使用基本原理是:按字母排列顺序,字母和排序在后面与其相邻的那个字母所构成的字母组合,就称作该字母的复式字母,表现形式为:字母a的复式字母是ab,字母b的复式字母是bc,……,字母z的复式字母是za。采用复式字母输入技术,每个字母都用2个字母表示,但在数字键盘上,每个字母都只对应1个数字键,复码数字键盘应用如下:

1)输入英文字母

例如输入字母am:把字母a复变成ab,字母m复变成mn,在表3复码数字键盘中,字母ab对应数字键是48,所以连续按数字键48可输出字母a;同样道理,连续按数字键32可输出字母m。采用复码数字键盘输入26个英文字母都不重码,这是复码数字键盘能够面向世界的基础,这种方法还适用于输入英文专有名词或词库中没有的词语。

2)输入英文词语

例如输入英文China:因为词库中有该词组,因此可按表3复码数字键盘直接输入数字68124就可以了。

3)输入汉语拼音

例如输入“中”和“中国”:“中”汉语拼音是Zhong,把首字母复变成ZAhong,在表3复码数字键盘中连续按数字键248026就可以了;同样道理,“中国”汉语拼音是Zhong guo,把该词组首字母复变成ZAhong guo,在表3复码数字键盘连续按数键248026670就可以了。采用首字母复变技术,可以把汉语拼音400多个不标调音节转换成数字汉语拼音都不重码,这是数字键盘汉语拼音输入由字处理向词处理过渡的基础,因此可把计算机的全拼输入法直接转换成手机的数字全拼输入法。

    4)输入汉语拼形

例如输入“中”和“中国”:“中”汉语拼形是oi,在表3复码数字键盘中连续按数字键01就可以了;同样道理,“中国”汉语拼形是oiqel,在表3复码数字键盘连续按数键01931就可以了。

以上只是简要的介绍了英文、汉语拼音、汉语拼形转换成数字英文、数字汉语拼音、数字汉语拼形的过程,详见《数字键盘复码字母键位设定原理》等文章

 

四、结论

目前在汉字编码出现了热、冷两个极端,汉字音码随着计算机功能的改善,《汉语拼音方案》迅速崛起,三十年来逐渐由冷变热,目前正向着巅峰发展,有人甚至认为这是能包揽一切的汉字输入法。与之形成鲜明对照的是汉字形码,三十年来因编码理论的滞后,导致形码编码踏步不前,人们对它的期望值逐渐由热变冷,目前已经受到空前冷落,虽然新的编码方案还在不时涌现,但已不再吸引人们的眼球。而目前“数字键盘字母键位设定”新标准研制工作,因无理论指导基本还在初始阶段徘徊,不会有质的突破。

汉字是一种“大气”文字,在异化理论中,字母和数字能够脱离原本的拼词功能或量的数值表达方式,借用其名称(读音)及形状来描述和指称汉字,汉字会积极迎合这种异化带来的动力,进一步延伸文字表达功能不断创造中华文明奇迹,《汉语拼音方案》在五十年前做到了,今天《汉语拼形方案》和《复码数字键盘》又将步其后尘。现在人们把《汉语拼音方案》定格为最佳方案,随着时间推移,未来一定会有人站出来说《汉语拼形方案》和《复码数字键盘》也是最佳方案。

东北深冬,室外气温已经降到了每年最寒冷的日子,汉字编码也正经历着诞生三十年来最严寒的冬季,但是,在全新的汉字编码理念下,随着《汉语拼音方案》、《汉语拼形方案》、《复码数字键盘》的结盟,汉字编码的春天正向人们走来,正如十九世纪英国著名浪漫主义诗人雪莱在《西风颂》中预言那样:冬天已经到了,春天还会远吗?借此笔者把下面这幅“迎春图”承献给汉字编码的春天:

 

 

借此笔者把下面这幅“迎春图”承献给汉字编码的春天

 

  

《汉字近形编码论文之十三》

辽宁省/本溪/高国鹫

E-mailhypx8798@yahoo.cn

注:hypx——“汉语拼形”每字的首位汉语拼音字母;

8798——是HYPX《复码数字键盘》转换构成的一组数字。

新浪网博客:汉字道

2009119

 

目前已发表的文章有:

1 《汉字编码三大定律》(20071213日)

2 《笔画组合理论与汉语拼形方案》(2008228日)

3 《数字键盘复码字母键位设定原理》(2008229日)

4 《挑战天下编码人》(2008319日)

5 《汉语拼形汉字输入法》(200847日)

6 《汉字编码——未来推动汉字演化的动力》(200866日)

7 《关于汉字编码第二次整理探讨》(200876日)

8 《论汉字编码数学原理》(2008820日)

9 《汉字编码与密码设置》(2008119日)

10 《汉字编码与互联网域名》(20081119日)

11 《汉字编码与电话号码》(20081221日)

12 《汉字编码与邮政编码》(200913日)

13 《字母异化·数字异化·汉字编码》(2009119日)

近期要发表的文章有:

14 《如何提升人们写信的热情》

15 《从汉字简化到汉字编码》

16 《〈汉语拼形方案〉问答》

 




阅读:
录入:

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:汉字编码与邮政编码

下一篇:汉字编码——对汉字简化的“否定”
相关文章       汉字  汉字编码三大定律 
本文评论
  GOOD!!!!!!!!!!!!!~~   (李居建 ,2009-05-05 )
  这篇文章写的很好.   (张元鸿 ,2009-02-13 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章