阅读文章

汉字编码与电话号码

[日期:2008-12-22] 来源:原创  作者:高国鹫 [字体: ]

    

前言

 

汉字编码自上世纪八十年代末诞生以来,经历了字处理阶段、词处理阶段、句处理阶段,未来汉字编码将由单一的输入功能向多元功能演化,这是汉字编码的最高阶段,是汉字编码演化的必然趋势,实现这一目标是个里程碑,标志着中国汉字编码最终走向成熟。

笔者在《论汉字编码数学原理》一文中,提出了汉字编码三要素:汉字、构件、汉字码,在这里,汉字、构件属汉字文化范畴,那么汉字码属什么?根据汉字码定义:表示汉字的字母、数字及其它符号组合叫汉字码,因此汉字码属工具,目前汉字码的工具属性是单一的,除了用于输入汉字没有其它用处,将汉字编码由单一的输入功能向多元功能演化,就是要改造汉字码属性,让汉字码在汉字文化的不同领域扮演更多角色。

汉语拼音是汉字的辅助工具,所以直接采用汉语拼音编码,主要还是为了输入汉字,但汉语拼音在拼写专名等方面又表现出文化属性,另外采用英文编码构成的文字码也具有文化属性,而且这种文化属性要比汉语拼音强烈得多,从这里我们似乎得到启发,改造汉字码的属性,拓展汉字码的使用功能,这在实践中是可行的。

拓展汉字码使用功能,需要在汉字编码理论上的创新和制定新的规范标准来支撑。汉字编码理论上的创新,就是要坚持科学发展观,丰富和发展汉字编码理论。制定新的规范标准,会涉及当前国际标准化问题,如果国际标准领先时,我们要在国际标准框架下“中国制造”,但是,当国际标准滞后时,我们要考虑中国制造“国际标准”问题。

汉字码包括字母组合和数字组合,对应字母键盘和数字键盘,代表设备计算机和手机。对计算机字母键盘,没有规定汉字的哪些构件和笔画对应哪个字母键位,完全是汉字编码的行为,因此在这一领域没有争议;但对手机数字键盘就不同了,如果手机保持原始状态,没有对字母和汉字构件、笔画进行设定,完全由汉字编码来决定,那也不会有争议,但是,一旦对数字键盘进行字母和汉字构件、笔画的设定,就具有排它性,如果这种设定方法不科学或不具代表性,就会保护落后或限制其它方法发展。

从目前数字键盘的各种输入方法看,种类比较多,方法也各异,规范的制定既要体现出科学性、先进性、还要兼顾不同类型,看来目前还是制定几个不同标准为宜,以满足不同编码类型和不同人群的使用需求,然后在市场竞争中逐渐淘汰。另外,因涉及知识产权问题,委托企业制定国家标准会具有局限性,也难以保证先进性和公正性,应该在国家有关部门主持下,在全国范围内进行征集,无论是企业还是个人都可以参与,经过专家团评审,媒体公布,最后由国家审批。

规范制定主要是考虑大结构,对细节不宜纠缠,这属企业行为,因此,对数字键盘字母键位设定规范征集后的评测,这里提出如下分三个层次评测方法供参考:

1、输入26个英文字母

这是第一个层次,是硬指标,是把中国标准推向世界的重要保证,首先应该确保。优秀的数字键盘字母键位设定方法,要最大限度保证26个英文字母的简单、快速输入。因为26个英文字母个数大于10个数字键,因此每个字母只按1键且不重复是不可能的,最好的结果是每个字母都按2键,且都不重复,还要记忆方便;其次是不等长码长的字母键位设定方式。

2、输入400多个不标调汉语拼音

这是第二个层次,是为输入汉语拼音制定的标准,这是在满足第一个层次之后的评测指标。最理想的数字键盘字母键位设定方法,是在满足第一个层次条件下,按照数字键上字母直接输入汉语拼音而不重复(指400多个不标调汉语拼音),这难度比较大;退一步即使不能做到理想化,也要考核接近这一理想化目标的程度;再退一步才能考虑联想输入,也就是先输入字,再联想输入词。

3、输入汉字形码

这是第三个层次,是最后要考虑的,目前汉字形码的研制,还处于发展之中,除了笔画输入法之外,其它方法目前还没有哪一种能得到人们的普遍认可,因此对输入汉字形码不宜统得过死。

以上条款应该是数字键盘字母键位设定评测和规范制定的核心内容,至于其它字符、重字键选率、平均码长等指标,因输入方法的不同而不同,不宜在规范中具体化,这属企业行为,要在市场竞争中得到优化。另外,科学设定数字键盘字母键位,不但要有先进性,还要把环保和能源作为重要指标来考核,要节省空间容量和降低研发成本。

 

  复码数字键盘简介

 

由笔者研发的《汉语拼形系列》输入技术,包括汉语拼音、汉语拼形、数字汉语拼音、数字汉语拼形,英文、数字英文六项内容,这在汉字编码由工具属性向文化属性转型中将起到桥梁的作用,其中汉语拼音和英文是已知的;汉语拼形、数字汉语拼形、数字汉语拼音、数字英文是新开发的;汉语拼音、汉语拼形、英文采用计算机通用字母键盘,数字汉语拼音、数字汉语拼形、数字英文采用复码数字键盘,详见《数字键盘复码字母键位设定原理》一文。

在下图中,图1是目前流行的数字键盘,这是参照国际标准制定的《国家数字键盘汉字输入通用要求》(GB/T 18031——2000),这种键盘属早期产品,科技含量少,后来采用T9技术解决不少技术难点,但因先天不足造成本身固有的缺陷是难以克服的,表现如下:

1、在输入英文字母或缩写词时,每个字母是不等长码,最少要按1键,最多要按4键,这种码长不等长数字键盘字母键位设定方法,不利于信息产业深入发展。

2、没有考虑中国的国情,如果直接用于汉语拼音字母键位设定,会造成用汉语拼音每次只能输入单个汉字,不能直接输入汉语词组,汉字输入仍滞留在字处理阶段。

3、使用范围仅限于短消息、通讯录、问候语等短文领域,阻碍了数字键盘产品向深层次拓展和开辟新的领域

4、因字母在数字键的分布欠规律性,而且手机键位小、嵌入的字母不好识别,这对初学者门槛高,阻碍了中老年人发送文字信息的积极性,目前在使用手机的用户中,用于发送文字信息的用户只占少数,这与数字键盘字母键位的设定不能说不无关系。

因此上述这种数字键盘属于淘汰产品。

2是笔者研发的复码数字键盘,具有一定的科技含量,特点如下:

1、采用复码技术输入26个英文字母,每个字母都是按两键而且都不重复,见《汉字编码与密码设置》文章附录1,这是复码数字键盘推向世界的重要保证。

2、采用复码技术输入汉语拼音400多个不标调音节,也都是不重复,见《汉字编码与密码设置》文章附录2,这是汉语拼音能够直接输入汉语词组的重要保证。

3、这种数字键盘考虑了中国的国情和在世界范围推广,应用在手机上,其功能趋近于计算机字母键盘,堪称手机中的“计算机”,只要多按一键,就可把汉语拼音输入法(全拼)直接转换成数字汉语拼音输入法,而不必重新学习其它输入方法,并把数字键盘中文输入技术由字处理阶段过渡到词处理阶段,使用范围可由短文延伸到文章。

4、这种数字键盘分布规律性强,可以直接通过联想而不用记键盘,因输入汉语拼音几乎没有改变原来的输入方法,这对于初学者入门的门槛低,能够拉动更多的人使用手机发送文字信息的行列,有利于用手机进行银行存储、证卷交易、网络浏览、收发电子邮件等业务的推广,并推动固定电话早日开通短信增值业务,因此推广普及具有重要意义。

5、这种数字键盘是把计算机键盘汉语拼音输入法直接移植到手机,而不必花很多人去研发新的适用于手机的汉语拼音输入法,因此能够降低研发成本,另外还可节省空间容量,相比之下属环保型产品。

 

1

 

2

 

a b c

3

 

 d e f

 

 

1

 

 I  J  L

   2

 

  N  Z

3

 

E M W

4

 

   g h i

5

 

   j k l

6

 

  m n o

4

 

A  K

5

 

S  T

6

 

C  G

7

 

  p q r s

8

 

  t u v

9

 

  w x y z

7

 

  U V Y

8

 

  B H X

9

 

  F P Q

 

0

 

0

 

  D O R

 

 

 

  1 (普通数字键盘)                            2(复码数字键盘)

 

复码数字键盘使用简单方便,基本原理是:按字母排列顺序,字母和排序在后面与其相邻的那个字母所构成的字母组合,就称作该字母的复式字母,表现形式为:字母a的复式字母是ab,字母b的复式字母是bc,……,字母z的复式字母是za。采用复式字母输入技术,每个字母都用2个字母表示,但在数字键盘上,每个字母都只对应1个数字键,复码数字键盘应用如下(在这里只要键入数字,输出的就是汉语或英文):

 

汉语       汉语拼音             复变                       数字汉语拼音

         Zhong                  ZAhong                     248026

         Guo                     GHuo                         6870

中国     Zhong guo            ZAhong guo                248026670

 

汉语       汉语拼音          数字汉语拼音     汉语拼形    数字汉语拼形

         Zhong                28026                   oi                  01

         Guo                   670                       qel               931

中国    Zhong guo          28026670                oiqel            01931

 

英文字母或缩写词                复变                     数字英文

a                                           ab                             48

EMBA                               EFMNBCAB               39328648

 

英文                                                                  数字英文

English                                                               3261158

China                                                                 68124

Science                                                              5613263

      

以上只是简要介绍了汉语拼音、汉语拼形、英文,以及数字汉语拼音、数字汉语拼形、数字英文的转换关系,详见《数字键盘复码字母键位设定原理》一文,在应用时,如果用数字键输入汉语拼音、输入英文字母或词库没有的英文词语时,要采用复变技术,如果英文词库已经有了该词语,或在其它领域应用时,例如密码设置、互联网域名、电信网码号、邮政编码等应用就完全没有必要复变了。

                 

                    电信网码号

 

  问题的提出

    1、中国已经进入信息产业大国,固定电话及移动电话用户总数已达近10亿户,我们每个人几乎都接触很多部电话号码,有个人之间电话号码、个人与部门之间电话号码、特殊业务部门电话号码、长途区号等,个人业务繁忙、交友多,需要记的电话号码要多些,目前固定电话或手机都用电话簿来存储电话号码,一旦没带手机或手机电池用完了,麻烦可能会接踵而来,那是否有不用记忆的电话号码呢?

2、从互联网发展远景看,每台计算机、固定电话和手机都可以搭建一个自己的网站,但目前互联网址、固定电话号码、手机号码之间是没有任何联系的,每样都需要记忆,这给人们的生活带来很多不便,那么网址、固定电话号码、手机号码能统一吗?

3、固定电话及移动电话号码是用0——9表示,然而人们对这10个数字的喜好程度是不同的,例如8与“发”谐音成为吉祥号码,4与“死”谐音成为忌讳号码,人们希望电话号码中含数字8越多越好,而不希望数字4出现,随着人们生活水平的不断提高,对吉祥号码的奢望也愈来愈高,目前择号费随着数字8位置及个数的不同,价格从几百元到数千元不等,最高的已超过上百万元人民币,但号码中数字8属稀有资源,不可能在所有号码中都含有数字8,如何解决这一矛盾?

  电信网码号现状与种类

固定电话和移动电话号码均由0——9数字组成,电话号码随着用户增加位数也在不断加长,电信网码号资源容量是无限的,但限制码长的码号容量是有限的,这里根据码号的长度将电话号码分成狭义电话号码和广义电话号码。

1、狭义电话号码

狭义电话号码指目前统配的电话号码,这是按国际惯例和中国的国情人为制定的,分国际长途区号、特殊号码和市话号码三种。

     1)国际长途区号

按国际电信联盟(ITU)规定,任何国家或地区的国际长途区号长度由1——3位组成,其中第一位是全世界九大区的编号,北美——1,非洲——2,欧洲——34,南美——5,南太平洋——6,独联体——7,东亚——8,远东和中东——9,中国属东亚区,区号是86

2)国内电话号码

由国际长途区号和国家内部号码组成,国际电信联盟(ITU)又规定了国际电话号码总长度不大于12位(不包括国际长话字冠00),中国区号86长度是2位,所以我国的国内号码总长度不大于10位。根据我国《全国电话号码编码制度》规定,国内电话号码由长途区号和市话号码两部分组成,长途区号是不等长编号,城市越大,区号位数越短,市号号码长度越长,市话容量也就越大。例如北京区号一位是1,市话号码长度不大于9位;天津区号二位,首位是2,市话号码长度不大于8位;各省会城市和大城市区号是三位,市话号码长度不大于7位。长途区号华北——3,东北——4,华东——56,中南——7,西北——9等。普通用户市号电话号码是按局或部门发放,这些号码对用户来说基本都是杂乱无章的。

3)特殊电话号码

根据我国《全国电话号码编码制度》规定,前面第一位数称为字头,规定0字头供长途直拨电话业务使用,长途区号属短号码,1字头是特服号码,短号码和1字头号码属特殊电话号码。“911”事件发生以后,数字组合911也成为特殊电话号码,这样的电话号码还有315315日消费者维权日)等,特殊电话号码属稀有资源。

特殊电话号码记忆方便,只用在公益事业、公用事业、长途区号等特殊部门,如匪警——110、火警——119、急救中心——120、天气预报——121、消费者投诉热线——12315等。

2、广义电话号码

包括狭义电话号码在内,广义电话号码不受码长限制,任意一组数字都可以成为电话号码。广义电话号码按等级划分,可分成基础电话号码、系统电话号码和顶级电话号码三个级别,其中基础电话号码涵盖了系统电话号码和顶级电话号码,系统电话号码涵盖了顶级电话号码。

1)基础电话号码

由数字任意组合构成的电话号码称为基础电话号码。例如1231208129992828228497698246386429等,狭义电话号码亦属于基础电话号码,基础电话号码杂乱无章,难以记忆,基础电话号码资源容量是无限的。

2)系统电话号码

在基础电话号码中,把有规律可循、容易被人们掌握的电话号码称为系统电话号码,例如短号码777888999等,长号码99998888123451234512345111222333等,系统电话号码资源容量也是无限的。

3)顶级电话号码

把字符排列简单、个数相对比较少、或有特殊意义的数字组合叫顶级电话号码。例如120126163,以及911315等。顶级电话号码与系统电话号码区别是,顶级电话号码是系统电话号码中投入使用极少部分,如果大量使用,那顶级电话号码也就不复存在了,顶级电话号码属稀有资源。

  电信网码号资源开发战略对策

基础电话号码、系统电话号码、顶级电话号码在容量上呈金字塔形,在塔底座是基础电话号码,塔腰是系统电话号码,塔尖是顶级电话号码。

基础电话号码资源容量巨大,取之不尽用之不竭;系统电话号码资源容量也是十分巨大,但无论是使用汉字的国家,还是使用拼音文字的国家,能够提供系统电话号码资源的种类有限;顶级电话号码资源属稀有资源,目前已经濒临枯竭。

上述这三种电话号码是可以转化的,基础电话号码能升级成为系统电话号码,系统电话号码也能升级成为顶级电话号码,这里把基础电话号码资源升级成为系统电话号码资源,或把系统电话号码资源升级成为顶级电话号码资源的过程称作电信网码号升级,电信网码号升级能把人们不愿意使用的电话号码转换成人们愿意使用的电话号码。

电信网码号资源开发战略对策就是有系统、大规模的电信网码号升级,因为基础电信网码号资源容量巨大,所以升级的重点是把基础电信网码号升级到系统电信网码号,当然,在升级后的系统电信网码号中,也不乏含有顶级电信网码号,那么这种大规模电信网码号的升级依托什么呢?

无论是使用汉字的国家,还是使用拼音文字的国家,语言文字资源是十分丰富的,依托语言文字的电话号码,能凸显人的个性,称之为个性电话号码。个性电话号码抛开人为因素,完全遵照电话号码客观存在的自然规律和满足人的自身利益,成为更富人性化、方便记忆的电话号码,是人性化服务在电信网码号领域的体现,是未来电信网新的增值业务

个性电话号码是大规模电信网码号升级的基础,是容量庞大的电信网码号资源转移过程,能把大量基础电信网码号资源转换成系统电信网码号资源,但是,如果找不到这种语言文字与电话号码之间的对应关系,那么这种大规模基础电信网码号资源升级只是一种幻想,因此,电信网码号工作的一项重要任务,就是寻找依托语言文字的个性电话号码。

  电信网码号升级原理

个性电话号码的选择具有随意性,码长不受国际电信联盟(ITU)为我国内号码确定的总长不大于10位的限制,因此,在目前电信网直接办理大规模个性电话号码业务意义并不大,必须另辟蹊径。

我们知道,在互联网系统,每台主机有IP地址和域名地址,其中IP地址是由Internet分配的唯一地址,是数字型标识,这对计算机网络是最有效的,但IP地址难记,因此Internet又设计了域名地址,域名地址由用户申请,汉字、字母、数字都可以用来域名,域名地址也是唯一的,用户可以使用域名地址进行相互访问,域名服务器自动将域名地址翻译成IP地址。

电信网个性电话网码号增值业务,可以借鉴InternetIP地址和域名地址,在电信网建立相应IP地址和域名地址,实际上电信网的IP系统已经形成,狭义电话号码也就是电信网IP地址,号码由电信部门统配。建立电信网码号域名系统,由用户申请注册,并把这种电话称为域名电话,电话号码称为域名电话号码,域名电话号码能够体现人的个性,是个性电话号码的主要组成部分。

域名电话号码是由哪些符号构成的呢?

目前中国大陆使用固定电话和手机的用户总数已近10亿户,其中3.7亿户固定电话目前尚没有办理发送短信业务,另5.7亿手机用户虽然具备发送短信条件,但因用手机发送汉字信息要比计算机难度大得多,实际发生短信业务的用户只占少数,这意味着电信网域名如果与互联网域名雷同,域名中含有汉字或字母,会把大多数手机用户排斥在外,这对电信部门无论怎样都是难以接受的,因此,域名电话号码是纯数字组合。

人们生活中离不开语言文字,语言文字资源是十分丰富的,个性电话号码是通过语言文字把人们不愿意使用的电话号码转换成人们愿意使用的电话号码,因此,域名电话号码一定要与字母或汉字建立某种联系,而且为了满足不同用户的需求,最好是将这种联系发展为除了可以用域名电话号码拨打电话之外,还可以用字母或汉字拨打电话,而且它们的功能应该是等价的,这也能够为互联网域名、电子邮箱、电信网移动电话和固定电话域名最终统一奠定基础。

按上述电信网域名要求,如果是事先选好一组数字组合,然后再寻找与这组数字组合对应的字母组合或汉语词语,这就又退回到选择号码的老路上来了,实际上,电信网域名恰恰是相反,域名过程首先是根据个人情趣选择一组汉语母体,然后再通过一种汉字编码,把汉语母体与一组字母组合相对应,目前能够满足这种要求的汉字编码唯有汉语拼音和汉语拼形,无论选用这两种中的哪一种,都能根据复码数字键盘找到一组对应的数字组合,这就是电信网域名电话号码。在输入域名电话号码时,先根据汉语母体找到对应的字母组合,在复码数字键盘找到对应的字母键,然后按键输入就可以了。

域名服务器接到汉语母体或字母(英文)母体之后,自动寻找域名电话号码,然后将域名地址翻译成电信网IP地址,这种对应关系是唯一的,因此,域名电话除了可以输入域名电话号码之外,也可以输入对应的字母电话号码或汉语母体电话号码,结果都是一样的。但是,因为这种对应关系是建立在汉字编码基础上的,汉字编码重码让域名电话号码对应的却不止一组字母组合或汉语词语,域名电话号码在注册的同时,也把域名电话号码对应的字母组合和汉语词语的所有重码也都连带进行了注册,这意味着输入汉语母体或字母(英文)母体的重码也能拨通电话,除非域名服务器具有屏蔽重码功能。

在汉语拼音状态下和汉语拼形状态下域名电话号码区别是:汉语拼音重音字多,域名电话号码对应的往往不止一组汉语词语,例如选择“石仁”为母体进行域名,对应字母组合是shiren,域名电话号码是581032,后来人如果用“诗人”为母体进行域名,对应的字母组合和域名电话号码也是shiren581032,因此系统将提示“诗人”已经被注册,实际像这样同时要被注册的汉语词语可能有很多,因此在汉语拼音状态下域名,汉语词语利用率低;而在汉语拼形状态下域名,因为汉字编码重码率低,所以汉语词语利用率高,但汉字的汉语拼形最长码可达12键,所以域名电话号码位数可能要长些。

关于电信网域名电话号码长度,从理论上讲个性电话号码的长度不应该有所限制,但考虑到资源的有效利用和电信网与互联网接轨,电信网域名长度应与计算机互联网域名长度统一起来,这样电信网域名电话号码长度与互联网域名长度是一样的,最大长度也是255个字节,这种码长能够满足大多数人的个性电话号码编码长度。

依托语言文字和个性电话号码的基础电信网码号升级主要包括以下内容:

1、依托汉语用字形和字母表示的系统电信网码号。

2、依托汉语用字形和数字表示的系统电信网码号。

3、依托汉语用字音和字母表示的系统电信网码号。

4、依托汉语用字音和数字表示的系统电信网码号。

5、依托英文用字母表示的系统电信网码号。

6、依托英文用数字表示的系统电信网码号。

  基础电信网码号升级的几种形式

采用计算机字母键盘与手机等复码数字键盘联袂输入技术,能把汉字、字母、数字纳入统一的电信网码号域名体系,这种体系共有3个下面分别介绍:

1、汉字—汉语拼形—数字汉语拼形域名体系

在这体系始端是汉语母体,在中国人们生活在汉语世界,天天都在使用汉语,每个人几乎都能掌握相同的汉语词语,汉语词语容量是十分丰富的;体系中端是汉语拼形,这是通过近形关系由汉语转换构成,是用字形和字母表示的汉语,资源容量等价于汉语词语,这是一个容量十分巨大的系统电话号码资源;体系末端是数字汉语拼形,这是汉语拼形通过复码数字键盘转换构成,是用字形和数字表示的汉语,资源容量亦等价于汉语词语,这也是一个容量十分巨大的系统电话号码资源,举例如下:

汉语母体                 汉语拼形               域名电话号码

王长城                   etgfajcl               35694161

黄山(管理局)           hibvw                  81873

荷都兰(公司)           hjtofjbpvz             8150918972

大灰狼                   hvxmslek               87835134

长长腿                   tgtguteklz             5656753412

总机                     vomxvu                 703877

 

下面以第一行为例进一步说明:

域名电话进入汉语拼形状态:王长城先生以自己姓名为依托申请了8位电话号码“35694161”,这是根据汉语母体“王长城”对应的汉语拼形“etgfajcl, 再由复码数字键盘(见图2)转换构成,在域名电话体系中,汉语母体电话号码、汉语拼形电话号码和域名电话号码完全都是等价的,与王长城先生通电话,可以直拨域名号码“35694161”,也可以拨字母号码“etgfajcl,还可以拨汉语母体号码“王长城”,至于采用哪种方法由用户决定。

下面介绍一组依托汉字的电话区号。

国内长途区号虽然为短号码,要想全都记住决非易事,这里提供一种全新的电话区号,这种区号有三种方法表示,即汉语区号、字母区号和数字区号,这三种区号代表意义完全相同,其中字母区号由汉语拼形构成,数字区号由复码数字键盘转换构成。字母区号构成是:二字汉语区号由第一、二字的汉语拼形首、末字母构成;三字汉语区号由第一、二字的汉语拼形首字母及第三字的首、尾字母构成。数字区号只要将字母区号按复码数字键盘直接转换成数字就可以了,用这种方法选出的字母区号和数字区号都是4位,而且没有重码,这种区号码长比较长,适用于域名电话。中国政区23个省、5个自治区、4个直辖市、2个特别行政区的汉语区号、字母区号和数字区号如下

汉语区号  字母区号   数字区号   汉语区号      字母区号    数字区号

1、贵州(省)  OVNN    0722        19、北京(市)   KFTN    4952

2、安徽(省)   LATX    1458        20、广西

3、宁夏                                          (壮族自治区) TJKO     5140

(回族自治区) LTTA     1554        21、广东(省)  TJFN     5192

4、河北(省)   ZOKF     2049        22、新疆

5、河南(省)   ZOXF     2089     (维吾尔自治区) TTSX    5558

6、江西(省)   ZIKO     2140         23、云南(省)  TGXF   5689

7、江苏(省)   ZIHY     2187         24、天津(市)  TVZI     5721

8、海南(省)   ZZXF    2289         25、福建(省)  TXEZ     5832

9、浙江(省)   ZTZI     2521         26、台湾(省)   GOZS    6025

10、湖北(省) ZTKF    2549         27、内蒙古

11、湖南(省) ZTXF    2589           (自治区)        UHXO    7880

12、澳门                                        28、甘肃(省)    HTEN    8532

 (特别行政区)ZVLU    2717         29、吉林(省)    FOXV    9087

13、辽宁(省) WZLT   3215         30、陕西(省)    PMKO    9340

14、山西(省)WWKO  3340         31、四川(省)    QVNN    9722

15、山东(省)WWFN  3392         32、黑龙江(省)QXZI      9821

16、青海(省)ETZZ     3522         33、香港

17、重庆(市) EBTV    3857        (特别行政区)     FBZP      9829

18、西藏                                        34、上海(市)    FFZZ      9922

   (自治区)    KOHL    4081         

 

下面是一位母亲给远在上海的儿子发的短信,儿子的名叫宇航,属马字号马蹄,中国重名者多,加字号能避免重名,发短信程序和内容是:域名电话进入汉语拼形状态:“上海/宇航,马蹄/航儿,几天没和家里联系了,妈妈惦记你,速回信。”然后按发送信息键。

以上短信内容由“/”号将信息分成三段,首段是政区号,汉字区号“上海”,也可改成字母区号“FFZZ”或数字区号“9922”,结果都是一样的;中段是呼叫对方在汉语拼形状态下用“宇航,马蹄”为母体注册了域名电话号码,由4个汉字组成,对应字母号码是“lufjuztucshoktvux,17个字母组成;域名号码是“17917257658045778”,由17位数字构成;末段是发送信息的内容,在整个信息中,政区号码、呼叫对方号码、信息正文都包括在内,所以在汉语拼形状态下,只要按回车键信息就发送出去了。

2、汉字—汉语拼音—数字汉语拼音域名体系

在这体系始端是汉语母体;体系中端是汉语拼音,这是用字音和字母表示的汉语,资源容量等价于汉语词语,这是一个容量十分巨大的系统电话号码资源;体系末端是数字汉语拼音,这是汉语拼音通过复码数字键盘转换构成,是用字音和数字表示的汉语,资源容量亦等价于汉语词语,这也是一个容量十分巨大的系统电话号码资源,举例如下:

汉语母体                汉语拼音                域名电话号码

王长城               wangchangcheng            34266842668326

黄山(管理局)         huangshan                 874265842

荷都兰(公司)         hedulan                   8307142

大灰狼                 dahuilang                 048711426

长长腿                changchangtui              6842668426571

总机                    zhongji                  2802611

 

下面以第一行为例进一步说明:

域名电话进入汉语拼音状态:王长城先生依托自己姓名注册了14位电话号码“34266842668326”,这是根据汉语母体“王长城”对应的汉语拼音“wangchangcheng, 再由复码数字键盘(见图2)转换构成,在域名电话体系中,汉语母体电话号码、汉语拼音电话号码和域名电话号码完全都是等价的,与王长城先生通电话,可以直拨域名号码“34266842668326”,也可以拨字母号码“wangchangcheng,还可以拨汉语母体号码“王长城”,至于采用哪种方法由用户决定。

下面还是那位母亲给远在上海的儿子发短信,发短信的程序和内容是:域名电话进入汉语拼音状态:“上海/宇航,马蹄/航儿,几天没和家里联系了,妈妈惦记你,速回信。然后按发送信息键。”

以上短信从表面看,与在汉语拼形状态下是一样的,其实不然,首段是政区电话号码,末段是用汉语写信,这与是在汉语拼形或汉语拼音状态无关,只是中段域名电话号码有所不同,因为这位母亲的儿子是在汉语拼音状态下以 “宇航,马蹄”为母体注册了域名电话号码,汉语拼音是“yuhangmati”,域名电话是“7784263451”,如果在短信中段不是用汉语号码,而是用字母号码或域名号码,那就不一样了。

3、英文—数字英文域名体系

在这体系始端是英文母体,英文系统电话号码资源容量是十分巨大的;体系末端是数字英文,由英文通过复码数字键盘转换构成,是用数字表示的英文,因此,数字英文电话号码资源容量等价于英文词语,这也是一个容量十分巨大的系统电话号码资源,这种方法适用于使用拼音文字的国家,举例如下:

英文母体                                    域名电话号码

Jack                                        1464

MICROSOFT                                   316005095

CHINA TELECOM                               681245313603

 

下面以第二行为例进一步说明:

域名电话进入字母状态:MICROSOFT公司依托公司名称注册了9位域名电话号码“316005095”,这是以英文MICROSOFT为母体,由复码数字键盘(见图2)转换构成的,“MICROSOFT”又称字母电话号码,字母电话号码和域名电话号码完全是等价的,与MICROSOFT公司通电话,可以拨域名号码“316005095”,也可以拨字母号码“MICROSOFT”,至于采用哪种方法由用户决定。

下面介绍一组依托字母的电话号码字冠:

对于网号、业务接入码、电话号码等,都是采用好记、醒目的数字组合作为字冠,如80012713917911等,但这样的号码一旦增多,后续使用效果就会变差,复码数字键盘可以提供一组以26个英文字母为原型的数字结构字冠供选择:

字母  复变   字冠            字母  复变  字冠

D——DE——03              S——ST——55

R——RS——05              T——TU——57

O——OP——09              C——CD——60

I——IJ——11                G——GH——68

L——LM——13              Y——YZ——72

J——JK——14               V——VW——73

N——NO——20              U——UV——77

Z——ZA——24               H——HI——81

M——MN——32             B——BC——86

W——WX——38             X——XY——87

E——EF——39               Q——QR——90

K——KL——41               F——FG——96

A——AB——48               P——PQ——99

 

4、趣味域名电话号码

域名电话进入汉语拼音状态:

1)汉字类

汉语母体         汉语拼音             域名电话号码        备注

发发发           fafafa                 949494

发发发888        fafafa888              949494888

发又发           fayoufa                9470794

8            fa8fa                  94894

888      fa8fa8fa8fa            94894894894

88             8fa8                   8948

8888           88fa88                 889488

百发百中         baifabaizhong          8419484128026

发财发           facaifa                9464194

财发财           caifacai               64194641

才发财           caifacai               64194641

捌捌捌           bababa                 848484

88         ba8ba8ba                84884884

8八捌            8baba                   88484

9九玖            9jiujiu                 9117117

九死一生         jiusryisheng            117507158326

金金金           jinjinjin               112112112

银金银           yinjinyin               712112712

金银铜铁         jinyintongtie           1127125026513

菜鸟(网语)     cainiao                 6412140

楼主(网语)     louzhu                  107287

粉丝(网语)     fensi                   93251

驴友(网语)     luyou                   17707

网虫(网语)     wangchong               342668026

烘培鸡(网语)   hongpeiji               802693111

钻石王老五(网语)zuanshiwanglaowu       2742581342614037    16个字符

 

下蛋公鸡,公鸡中  xiadangongjigongjizh   81404260261160261128

的战斗机!oh!yeaf! ongdezhandoujiohyeah  02603284200711087348 含40个字符

 

白日依山尽,黄河 bairiyishanjinhuanghe  841017158421128742683

入海流,欲穷千里 ruhailiuyuqiongqianli  078411177791026914211

目,更上一层楼。 mugengshangyicenglou   37632658426716326107  含62个字符

 

2)字母类

字母母体                     域名电话号码             备注

OOOAAAOOO                     000444000

PMPMP(网语)                 93939                  拼命拍马屁

Cybea Pinup(网语)           6783491279             网上美人

Charming Girl(网语)         684031266101           可爱的女孩

I only want to be witn you    10217342550833152707   我只想和你在一起

 

3)数字类

域名电话号码                                             备注

1314925(网语)                                      一生一世就爱我

001000(网语)                                       我很孤独

2030999(网语)                                      爱你想你久久久

6785753(网语)                                      老地方不见不散

 

5、其它类型个性电话号码

下面介绍的这几组个性电话号码比较简练、随意性强,汉字、字母、数字之间没有汉字编码对应关系,因此这些号码虽然属于个性电话号码范畴,但不是域名电话号码,因此,这样的个性电话号码在向人们介绍时,也要公布电话号码中每段的含意。

1)汉语音、形混合号码

对于码长有一定要求的电话号码可采用汉语拼音、汉语拼形混合编码,对汉语拼音,只用汉字的汉语拼音首字母,汉语拼形可根据电话号码的位数确定,下面介绍几个8位个性电话号码:

汉语词语     汉语音形  个性电话号码         个性电话号码构成

故宫博物院   ggbwyxvp   66837879    每字首音、末3个字汉语拼形首字母

长城         cctgfajc   66569416    每字首音、其余由词组汉语拼形字母补充

计划部       jhblixal   18811841    每字首音、其余由词组汉语拼形字母补充

李老K       llkxvwhf    11487389    每字首音、其余由词组汉语拼形字母补充

小淘气鬼     xtqgnzkj    85962241   每字首音和首形

白面书生     bmssjtwv     83551537  每字首音及首形

运输车间主任(室)yscjzrtj75612051  每字首音,末2字首形

2)以315作尾号的投诉类电话

消费者投诉热线电话是12315,尾号315表示315日消费者维权日,构成顶级电话号码,除了消费者投诉电话之外,目前在不同领域借助字冠123还设了很多投诉电话,例如12348市长投诉热线、12358物价局投诉电话、12369环保投诉电话,按照同样方法,只要更改末两位码号,还可以设更多的投诉电话,但是,用这种方法设立的投诉电话如果多了效果并不理想,这些派生出来的投诉电话号码都没有最初的电话号码12315好记,因此说这类投诉电话号码虽然沿着人性化服务迈出了一步,还应该再迈一步。

下面是根据字冠123、汉字、尾号315构成的长码顶级个性电话号码,加字冠123是因为1字头为特殊电话号码,加尾号315是把它拓展成广义投诉电话的标识符,这能把特殊电话号码由短号码扩展成为长码号,这类电话号码越多,效果越突出。

汉语词语  汉语拼音首字母 复码数字键盘转换 个性电话号码   备注

动物(投诉电话)   DW         03           12303315      虐待动物

人权(投诉电话)   RQ         09           12309315

物价(投诉电话)   WJ         31           12331315

市长(投诉电话)   SZ         52           12352315

环保(投诉电话)   HB         88           12388315

妇女(投诉电话)   FN         92           12392315 拐卖妇女儿童家庭暴力

 

3)以110作尾号的举报类电话

从投诉类电话引申过来,把110匪警电话用作尾号,具有威慑作用,成为举报类电话号码标识符。

汉语词语   汉语拼音首字母 复码数字键盘转换 个性电话号码     备注

地税(举报电话)  DS          05          12305110   偷漏税

毒品(举报电话)  DP          09          12309110   吸毒、贩毒、制毒

价格(举报电话)  JG          16          12316110   欺诈、哄抬物价等

走私(举报电话)  ZS          25          12325110   走私活动

恐怖(举报电话)  KB          48          12348110   恐怖、破坏、盗窃机                                                          密活动

偷渡(举报电话)  TD          50          12350110     

生物(举报电话)  SW          53          12353110 引进有害动植类等物种

国税(举报电话)  GS          65          12365110   偷漏税

腐败(举报电话)  FB          98          12398110

 

4)以100作字冠服务类电话

目前中国电信客户服务电话是10000、中国联通客户服务电话是10010、中国移动客户服务电话是10086、中国铁通客户服务电话是10050、中国网通客户服务电话是10060。下面把这些电话的尾号略加调整,看是否更容易记呢?

汉语词语     汉语拼音首字母  复码数字键盘转换     个性电话号码     备注

(中国)电信       DX              08                10008

(中国)联通       LT              15                10015

(中国)移动       YD              70                10070

(中国)铁通       TT              55                10055

(中国)网通       WT              35                10035

 

4)以955作字冠服务类电话

目前中国工商银行客户服务电话是95588、中国建设银行客户服务电话是95533、中国农业银行客户服务电话是95599、中国银行客户服务电话是95566、交通银行客户服务电话是95559、中国光大银行客户服务电话是95595、中信实业银行客服热线是95558、中国民生银行客服热线是95568、华夏银行客户咨询热线是95577、招商银行客服咨询热线是95555、兴业银行客户服务中心是95561,下面把这些电话的尾号略加调整,看是否更容易记呢?这里交通银行和建设银行电话号码重码,需另想法解决。

汉语词语    汉语拼音首字母复码数字键盘转换 个性电话号码   备注

交通(银行)       JT              15           95515     交通银行

建设(银行)       JS              15           95515     中国建设银行

招商(银行         ZS              25           95525

中国(银行)       ZG              26           95526     中国银行 

农业(银行)       NY              27           95527     中国农业银行

中信(银行)       ZX              28           95528     中信实业银行

民生(银行)       MS              35           95535     中国民生银行

光大(银行)       GD              60           95560     中国光大银行

工商(银行)       GS              65           95565     中国工商银行

兴业(银行)       XY              87           95587

华夏(银行)       HX              88           95588

 

无论是使用汉字的国家还是使用拼音文字的国家,着力推广普及计算机字母键盘与手机等复码数字键盘联袂输入技术,对于推动信息产业发展、方便人们生活都具有普遍意义。

作为本文的结束语,下面把二位久别相逢的朋友临别时的对话记录如下:

甲——(掏纸和笔)请把电话号码给我,以后我们经常联系。

乙——“大灰狼”!

甲——老兄挺赶时髦,穿件灰大衣咋就成“大灰狼”了,把网址或邮箱也给我。

乙——都是“大灰狼”,哦!对了,如果找你呢,是不是把你的也都留下(掏纸和 笔)。

甲——(沉默片刻)你能猜得出来!

乙——(看着甲的两条细长腿)不会是叫“长腿”吧!

甲——你太聪明了!我的手机、网址、邮箱都叫“长长腿”。

乙——哈哈!

甲——哈哈!

话都说到这份了,还用得着纸和笔去记吗?当然这里也有遗漏,因为在汉语拼形状态下或汉语拼音状态下是不同的,如果是在汉语拼音状态下域名,对外应该这样宣传:

汉语拼音状态:手机号码——大灰狼

互联网址——大灰狼

电子邮箱——大灰狼

 

 

《汉字近形编码论文之十一》

辽宁省/本溪/高国鹫

E-mailhypx8798@yahoo.cn

注:hypx——“汉语拼形”每字的首位汉语拼音字母;

8798——是HYPX经复码数字键盘转换构成的一组数字。

新浪网博客:汉字道

20081222

 

目前已发表的文章有:

1 《汉字编码三大定律》(20071213日)

2 《笔画组合理论与汉语拼形方案》(2008228日)

3 《数字键盘复码字母键位设定原理》(2008229日)

4 《挑战天下编码人》(2008319日)

5 《汉语拼形汉字输入法》(200847日)

6 《汉字编码——未来推动汉字演化的动力》(200866日)

7 《关于汉字编码第二次整理探讨》(200876日)

8 《论汉字编码数学原理》(2008820日)

9 《汉字编码与密码设置》(2008119日)

10 《汉字编码与互联网域名》(20081119日)

11 《汉字编码与电话号码》(20081222日)

近期要发表的文章有:

12 《汉字编码与邮政编码》

13 《从汉字简化运动到汉字编码运动》

                     




阅读:
录入:

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:关于改良汉字的研讨

下一篇:尴尬人说尴尬话
相关文章       汉字  汉字编码三大定律 
本文评论
  不好 没能拿出台面   (张肖想 ,2014-06-13 )
  厉害   (爱爱爱 ,2009-12-05 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章