前 言
目前在汉字编码活动中,除了庞大的计算机键盘汉字编码大军之外,手机等数字键盘的汉字编码也是异军突起,形成一支不可小觑的力量,那么与字母键盘相比,数字键盘汉字编码有哪些特点呢?
计算机键盘每个字母键位都是固定的,汉语拼音采用拉丁字母方案,所以汉语拼音字母键位的设定,与计算机键盘的字母键位设定是一致的,不需要重新对汉语拼音字母键位设定,汉字形码编码是在现有字母键盘进行键位设定。
对于手机等数字键盘,十个数字键在键盘的位置是固定的,除了输入数字之外,还需要输入英文和汉语拼音,但数字键本身并不具有这些功能,因此要在数字键盘对英文字母和汉语拼音字母进行键位设定,当然最理想的是能把这两种键位设定统一起来,并最大限度满足英文和汉语拼音的输入。
然而目前数字键盘字母的键位设定,在输入英文字母时码长是不等长,汉语拼音每次只能输入单字而不能输入词组,说明这种数字键盘字母键位设定存在着一定缺陷,这是引起数字键盘汉字编码风起云涌的直接原因,为了平息这场争端,需要对目前数字键盘英文和汉语拼音字母的键位设定进行评测,要从理论上进行充分论证,看是否能在现有基础上对英文和汉语拼音输入同时得到最大优化,然后再去考虑汉字形码编码的问题,为数字键盘字母键位设定有关规范的修改与完善提供理论依据。
本文综合数字键盘英文、汉语拼音及汉语拼形输入特点,以缩小手机等数字键盘与计算机字母键盘的使用功能为宗旨,把近形原理用于数字键盘的字母键位设定中,提出了数字键盘复码字母键位设定方法及相应输入技术,这是迄今为止与计算机字母键盘在使用功能上最为接近的数字键盘,每个字母码长均为2键,相当于把计算机字母键盘浓缩成手机等数字键盘,形成计算机字母键盘与手机等数字键盘联袂输入技术,可把计算机字母键盘的汉语拼音、汉语拼形、中值码等输入法及英文词库整体移植到数字键盘,转换成相对应的数字汉语拼音、数字汉语拼形、数字中值码及数字英文,数字键盘中文输入技术将由字处理阶段过渡到词处理阶段,使用范围也由短文延伸到文章,为数字键盘产品向深层次拓展和开辟新领域奠定了基础。
一 数字键盘应用现状
在中国大陆,以手机为代表的移动信息装置及固定电话等数字键盘,汉语拼音字母键位设定是根据《信息技术数字键盘汉字输入通用要求》(GB/T 18031—2000)确定的,这是参照国际标准共提出两种设定方法,一种是10键位汉语拼音字母键位设定,另一种是8键位汉语拼音字母键位设定,我国目前流行的是后一种。
手机起源于国外,因此,以手机为代表的数字键盘拼音字母键位设定,是不会考虑到汉字输入的,至于输入英文等拼音文字是否是最佳方案也值得商榷,例如,当用这种数字键盘输入英文字母时,码长是不等长,最少要按1键,最多要按4键,因此,这种码长不等长的字母键位设定,本身就存在着严重缺陷,属先天不足。据统计,无论是在计算机还是在手机等数字键盘汉字输入人群中,使用汉语拼音的用户已经成为汉字输入的主体,这是一个数值庞大的群体,如果对这种数字键盘不加任何改造,直接用于汉语拼音字母键位设定,会造成用汉语拼音每次只能输入单个汉字,不能直接输入汉语词组,因此影响面是巨大的,对于汉字形码输入,目前是在数字键盘上用数字键直接标识部件或笔画,与数字键字母没有任何关系。
随着信息技术深入发展和3G时代的到来,手机等数字键盘的应用领域愈加趋近于计算机,人们可以通过手机进行银行存储、证卷交易、论坛演说、网络浏览、收发电子邮件等,因此同计算机一样,也会遇到大字符集生僻字输入的问题,这当然可以模仿计算机字母键盘汉字编码的方法,采用近形原理来解决,但这是字母与数字有关联的形码编码方案,那目前这种数字键盘字母键位设定就不能胜任了,因此在使用上具有局限性,造成在输入汉语拼音或汉语拼形时,与字母键盘相差甚远,汉字输入仍滞留在字处理阶段,使用范围也仅限于短消息、通讯录、问候语等短文领域,阻碍了数字键盘产品向深层次拓展和开辟新的领域,例如固定电话网目前还是单一语音通道,文字消息传播还处于停滞状态。因此,如何针对中国国情科学设定数字键盘字母键位,让数字键盘最大限度接近于字母键盘的功能,形成具有我国自主知识产权的汉字输入技术,让用户在数字键盘汉字输入中有更多的选择,这是目前急需解决的问题,也是本文要讨论的问题。
二 数字键盘复码字母键位设定原理
数字键盘复码字母键位的设定,是把用于计算机字母键盘汉字编码的近形原理,拓展到数字键盘汉字编码领域的产物,其特点是这种数字键盘并不直接对汉字编码,按照近形原理,汉字可以用字母键编码,字母可以用数字键编码,根据等价关系,汉字也可以用数字键编码,下面介绍数字键盘复码字母键位设定方法。
1、复式字母
采用数字键输入字母,在数字键盘上如果每个字母都用1个数字来表示,也就是每个字母只对应1个数字键,那么26个字母对应10个数字键,因字母过剩会产生多个字母对应1个数字键,因而造成重码;如果每个字母都用2个数字来表示,也就是每个字母对应2个数字键,虽能避免产生重码,但26个字母如何设定在10个数字键位上,目前还没有好方法,在这里数字键盘字母键位的设定给人们出了一道难题:能否找到这样一种方法,让每个字母都用2个数字来表示,但每个字母只能设定在1个数字键位上,要求简单实用和方便记忆,现在可以肯定地说这种方法是有的,采用复式字母输入技术就能妥善解决,下面定义复式字母:
按字母排列顺序,字母和排序在后面与其相邻的字母构成的字母组合,就称作该字母的复式字母,表现形式为:字母a的复式字母是ab,字母b的复式字母是bc,……,字母z的复式字母是za,采用复式字母输入技术,每个字母都能用2个字母表示,所以在数字键盘上虽然每个字母都只对应1个数字键,但却都能用2个数字来表示。
复式字母作用:为数字键盘输入字母时不产生重码提供了保证。
2、近形码
按近形原理将字母键A—Z与数字键0—9之间建立某种在字形上相近的对应关系,并把与字母相似的数字就称作字母近形码,简称近形码,字母与近形码转换对照表见表1:
字母与近形码转换对照表 表1
字 母 |
近形码 |
相 似 点 |
D、O、R |
0 |
D、O相近;R具有封闭结构 |
I、J、L |
1 |
近形 |
N、Z |
2 |
N旋转90度,Z近形 |
E、M、W |
3 |
E旋转180度,M顺向旋转90度,W逆向旋转90度 |
A、K |
4 |
A末笔向左延伸,K首笔向右移与末笔下部相交,旋转一定角度 |
S、T |
5 |
S近形,将数字5末笔向左延伸首笔拉直与T近形 |
C、G |
6 |
笔序走势一致 |
U、V、Y |
7 |
将U、V、Y逆向旋转90度开口方向与数字一致 |
B、H、X |
8 |
B近形,将H、X上下两端都封闭 |
F、P、Q |
9 |
上部大 |
近形码作用:在数字键盘利用字母与数字在字形上相近的对应关系,实现用数字标识字母以方便记忆,从而达到用数字键简单快速输入字母目的。
3、复码
将复式字母按表1转换构成的数字组合就称作复式字母近形码,简称复码,见表2。
字母、复式字母与复码转换对照表 表2
字母 |
复式字母 |
复码 |
字母 |
复式字母 |
复码 |
A |
AB |
48 |
N |
NO |
20 |
B |
BC |
86 |
O |
OP |
09 |
C |
CD |
60 |
P |
PQ |
99 |
D |
DE |
03 |
Q |
QR |
90 |
E |
EF |
39 |
R |
RS |
05 |
F |
FG |
96 |
S |
ST |
55 |
G |
GH |
68 |
T |
TU |
57 |
H |
HI |
81 |
U |
UV |
77 |
I |
IJ |
11 |
V |
VW |
73 |
J |
JK |
14 |
W |
WX |
38 |
K |
KL |
41 |
X |
XY |
87 |
L |
LM |
13 |
Y |
YZ |
72 |
M |
MN |
32 |
Z |
ZA |
24 |
复码作用:采用数字键盘输入字母,如果说复式字母能够确保不产生重码,近形码能够简单快速输入字母,那么复码的作用正是上述这两项技术的综合实施。
4、数字键盘复码字母键位设定
数字键盘复码字母键位设定见表3,并把由此构成的数字键盘称作复码数字键盘,表中第一行与第三行可以互换位置。
数字键盘复码字母键位设定 表3
1
I J L |
2
N Z |
3
E M W |
4
A K |
5
S T |
6
C G |
7
U V Y |
8
B H X |
9
F P Q |
|
0
D O R |
|
三 复码数字键盘主要功能
目前,计算机字母键盘与手机等数字键盘原本是没有任何联系的,既使把26个字母镌刻在手机的10个数字键上,那也只不过是在利用数字键位,与数字键名称没有实质性联系,但数字键盘复码字母键位设定,使这两种键盘建立起了有机的联系,计算机字母键盘的使用功能在数字键盘上不但得到了最大展现,而且数字键盘的很多功能也是字母键盘所不能比拟的,形成字母键盘与数字键盘在使用功能上具有互补性,前者适用于大型或固定设备,而后者适用于微型或移动设备,复码数字键盘使用功能如下:
(一)文字输入功能
采用复码数字键盘文字输入技术,能将计算机字母键盘的输入法整体移植到数字键盘,转换成相对应的数字键盘输入法,推动数字键盘文字输入由字处理阶段过渡到词处理阶段,使用范围由短文延伸到文章,下面介绍复码数字键盘文字输入的几种方法:
1、数字汉语拼音输入法
作为对比,首先介绍T9智能中文输入法,目前在数字键盘产品中,最具代表性是手机,在全球手机中文输入法市场,目前已形成诺基亚(Nokia)的T9智能中文输入法,摩托罗拉(Motorola)的iTAP智能按键输入法以及爱立信(Ericsson)的字能中文输入法三大品牌,在这三大品牌中,T9智能中文输入法位居榜首,这是由Tegic Communications软件公司推出的,得到了十几个手机厂的支持。
因为一个数字键载有三至四个字母,因此输入一个字母有时需要按三至四次键,严重影响了输入效率,而T9智能中文输入法率先突破了这种落后的输入方式,无论字母在数字键上的排序位置如何,输入每个字母都只按一次数字键,直到把一组字母输入完,内部数据库会自动搜索可能的字母组合,然后进行选择。例如输入词组“好处”,汉语拼音为Hao chu,因为这种输入法不能直接输入词组,因此要先输入“好”字的汉语拼音Hao,而h、a、o分别位于数字键4、2、6上,所以只要连续按这三个键,屏幕会提供gao、hao、gan、han四种可能的字母组合供选择,然后选择hao,屏幕出现“好号毫耗浩豪郝皓……”等,通过软键选择输入“好”字后,候选区字表同时进行更新,显示所有以候选字“好”为首字的常用词组的下一个字“的象不好像几处了……”等,因为这里有“处”字,所以可用软键直接选择,如果候选区字表没有“处”字,就需重新输入,在输入过程中,如果需要键入的字已经出现在候选区字表,也可直接选择。
从上面介绍可以看出,T9智能中文输入法虽然比传统输入方式进步了许多,但仍没有摆脱字处理阶段,使用范围也仅限于短文领域。下面介绍复码数字键盘汉语拼音输入方法:首先定义复式汉语拼音和数字汉语拼音:将单字或词组汉语拼音的首字母转换成复式字母构成的字母组合称作复式汉语拼音;将复式汉语拼音按表1进行转换构成的数字组合称作数字汉语拼音。复码数字键盘输入汉语拼音,要先将汉语拼音转换成复式汉语拼音,再转换成数字汉语拼音,然后就可以直接按数字键输入了。
在表3数字键盘复码字母键位设定中,已经考虑到了数字汉语拼音的输入,对于汉语拼音408个不标调音阶(GB 2312—80)转换成的数字汉语拼音,做到了全部不重码,这是数字键盘汉语拼音输入技术由字处理向词处理过渡的基础。下面是复码数字键盘手机用汉语拼音输入词组“好处”的全过程:“好处”汉语拼音为Hao chu,复式汉语拼音为Hiao chu,数字汉语拼音为8140 687,所以只要连续按相应的8、1、4、0 、6、8、7键,输出的就是词组“好处”,具体输入过程是:因为复式字母的第二位字母在手机上是不能直接显现的,因此在输入Hao chu的第一个字母H时,按H所对应的数字键8,手机屏幕会提示“B6”、“H1”及“X7”供选择,然后按1键(复码输入HI按1键;BC按6键;XY按7键),当熟练掌握了每个字母的复码以后,就没必要再看屏幕提示了,剩余的字母可根据数字键盘上每个字母所对应的数字键位,按照顺序输入就可以了,如果手机词库里没有要输入的词组,就需要单个字输入,如果有重码再进行选择。
因为数字汉语拼音头两位数字里没有00、11、22、33、44、66、77、88这些特殊数字组合,因此这些数字组合可以作为控制键使用或让屏幕显示各种符号供用户选择:
下面再举例说明数字汉语拼音的输入过程:
汉字或词组 汉语拼音 复式汉语拼音 数字汉语拼音
中 Zhong ZAhong 248026
国 Guo GHuo 6870
中国 Zhong guo ZAhong guo 248026670
人民 Ren min RSen min 0532312
好处 Hao chu Hiao chu 8140 687
2、数字汉语拼形输入法
主要是由计算机字母键盘的汉语拼形输入法按表1直接转换成数字汉语拼形就可以了,最大码长为12键。因为汉语拼形适用于大字符集生僻字和古汉语输入,以及挂接到其它汉字输入法中检索字,因此数字汉语拼形与汉语拼形一样,也适用于大字符集生僻字和古汉语输入,以及挂接到其它汉字输入法中检索字,所不同的只是数字汉语拼形输入法适用于复码数字键盘,数字汉语拼音输入法也可以挂接到其它数字键盘的汉字输入法中检索字。
3、数字中值码输入法
中值码为音形码,其转换成数字中值码的过程同汉语拼音的转换过程一样,先将中值码首字母转换成复式字母,然后再按表1转换成对应的数字组合就可以了:
1)符号输入:键入一码是符号名称首位汉语拼音所对应的常用符号:
符号 名称 汉语拼音首字母 数字中值码
, 逗号 d 0
= 等号 d 0
。 句号 j 1
+ 加号 j 1
- 减号 j 1
: 冒号 m 3
? 问号 w 3
× 乘 c 6
÷ 除 c 6
2)简码输入:单字简码输入为二码;双字词简码输入为三码,只要先将中值码简码的首字母转换成复式字母,然后再按表1转换成对应的数字组合就可以了:
词语 中值码 复式中值码 数字中值码
的 d de 03
在 z za 24
我 w wx 38
大家 dj dej 031
人们 rm rsm 053
3)单字与词组输入:单字输入为四码,词组输入为五码,只要先将中值码单字或词组的首字母转换成复式字母,然后再按表1转换成对应的数字组合就可以了:
词语 中值码 复式中值码 数字中值码
中 zoi zaoi 2401
国 gql ghql 6891
中国 zgoq zagoq 24609
中国人 zgrv zagrv 24607
中国人民银行 zgrm zagrm 24603
4)挂接输入法:挂接了数字汉语拼音及数字汉语拼形输入法,因此是不需要备用字典的数字键盘中文输入技术,主要用于数字汉语拼音和数字汉语拼形检字,最大码长12键。在输入过程中,当遇到写不出字形字时,只要输入字母11就会自动切换到数字汉语拼音输入法检索字;当遇到读不准字音字时,只要输入字母33,就会自动切换到汉语拼形输入法检索字,挂接的输入法不包含词组。
4、数字英文输入法
1)复码英文输入法
目前手机等数字键盘在输入英文专有名词或词库中没有的词语时,每个字母最多时需要重复按4次键,直到所需的字母出现时为止,因此限制了输入速度。采用复码英文输入法,先把英文的每个字母均转换成复式字母构成复式英文,再按表1转换成复码英文,然后就可以按表3数字键输入了,每个字母只需按两键:
英文 复式英文 复码英文
A AB 48
FOUNDER FGOPUVNODEEFRS 96097720033905
KNM-ER1470 KLNOMN-EFRS1470 412032-39051470
POWERPOINT PQOPWXEFRSPQOPIJNOTU 99093839059909112057
SABMIS STABBCMNIJST 554886321155
2)数字英文输入法
需要手机等数字键盘产品携带英文词语库,把词语库中的每条词语均按表1进行转换构成数字英文,这时只要输入数字英文输出的就是英文词语,特点是往往没有输入完全部数字英文时词语就已经产生了,因此能提高输入速度,但有少量重码需要选择:
英文 数字英文
English 3261158
Science 5613263
Windows 3120035
输入德、法、意及西班牙文等拼音文字与输入英文类同。
(二)文字排序功能
因为汉语拼音、汉语拼形、英文都能直接用字母表示,所以汉语拼音具有字音按字母排序功能,汉语拼形具有字形按字母排序功能,英文原本就具有字母排序功能。复码数字键盘相当于是由计算机字母键盘浓缩成,所以由数字键盘转换成的数字汉语拼音、数字汉语拼形和数字英文,除了增加部分重码以外,其基本功能没有发生实质性改变,都能用数字表示,所以也都具有排序功能,只不过前者是用字母排序,而后者是用数字排序。
《汉字近形编码论文之三》
辽宁省/本溪/高国鹫
E-mail:hypx8798@yahoo.cn
2008年2月29日