【摘要】手机拼音输入方法是众多用户之首选,但其音、字重码多,选择操作繁复,难以满足用户的快速输入要求。本文介绍笔者原创的拼写无重码数字拼音输入法编码方案,通过9键位字母设定的数字键盘和数字拼音方案,自然区分重码音节,唯一编码,实现了1-4码内对所有音节拼写无重码的快速输入。在软件层次上辅以智能化处理和人性化设计,可使输入或检索汉字变得轻松、流畅和快捷。
一、 概述
有专业媒体的专题调查数据显示,“93.5%的被访者对所使用的手机输入法表示不满意,特别对于重音、重字率高,输入效率低的问题;有76.4%被调查者选择拼音作为首选输入法”。由于当前流行的手机拼音输入法普遍存在着编码效率低的“先天不足”,尽管经过软件的智能化“后处理”,效率瓶颈依然,亟待改进。显然,根本在于编码技术上突破。
二、 创建数字键盘9键位字母设定
分析编码效率瓶颈,一是基本汉语拼音的基本音节组合仅4百多个,GB2312就有6763汉字,而GBK大字符集则在2万之上,同音字重码多达数百个,需要合理离散,例如ji, yu等;二是26字母复用分布在8个数字键位,按照字母对应数字键单键输入拼写音节重码多达6个,需要人工交互选择,例如:键入726屏幕出现6个重码音节pan pao ran rao san sao;三是汉语拼音每个音节1—6个字母不等,拼写击键次数较多,例如chuang。可见,数码拼音输入除了同音字重码多之外,又增加了音节重码问题,数码拼音输入首要解决的是实现快速唯一拼写。现代汉语拼音声母20多个,韵母30多个,都在2位数字之内,因此,由声、韵母拼写而成的单音理论上只要4位数字即可唯一编码。
1、由于音节拼写重码,导致操作烦琐耗时费力,第一步需要在国标规范指引下找到规律,解决音节数字编码的唯一性。
表一:国标GB/T18031-2000中与国际接轨的8键位汉语拼音字母键位设定:
数字键 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
字母 |
ABC |
DEF |
GHI |
JKL |
MNO |
PQRS |
TUV |
WXYZ |
表二:创建的9键位汉语拼音字母键位设定:
数字键 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
字母 |
AGB |
OKP |
EHM |
IJF |
UQD |
VXT |
NZN |
YCL |
WSR |
从表二中不难发现,键盘上每一个键位仅包含一个韵母和两个声母,其中:前位声母用所在键位数码表示,后位声母用0+所在键位数码表示。
2、针对音节编码长短不一,特别是复韵母冗余度高的问题,第二步要在拼写规范内有效压缩韵母码长,减少击键数。
表三:汉语拼音韵母
|
iv[i] 衣【46】 |
uv[u] 乌【56】 |
vv[v] 鱼【66】 |
av[a] 啊【16】 |
yv[ia] 呀【86】 |
wv[ua] 蛙【96】 |
|
ov[o] 喔【26】 |
|
uo 窝【52】 |
|
ev[e] 鹅及特的韵母【36】 |
ie 叶【43】 |
|
ve 月【63】 |
ai唉【14】 |
|
wi[uai] 歪【94】 |
er 耳【30】 |
ei诶【34】 |
|
ui[uei] 威【54】 |
|
ao熬【12】 |
yo[iao] 腰【82】 |
|
|
ou 欧【25】 |
iu [iou] 忧【45】 |
|
|
an 安【17】 |
yn[ian] 烟【87】 |
wn[uan] 弯【97】 |
va[van] 冤【61】 |
nv[en] 恩【76】 |
in 音【47】 |
un[uen] 温【57】 |
vn 晕【67】 |
aw[ang] 昂【19】 |
yw[iang] 央【89】 |
ww[uang] 汪【99】 |
|
ew[eng] 亨的韵母【39】 |
iw[ieng/ing] 英【49】 |
uw[ueng/ong] 翁【29】 |
vw[veng/iong] 雍【69】 |
所有3-4字母长的复韵母只需2位数字码即可唯一确定,节省击键数。例如:
ang=19, eng=39, ing=49, ong=59;
ian=87, iao=82;
uai=94, uan=97, van=61;
iong=69,iang=89 , uang=99。
如果作为韵母音节,韵母两码数字化后+数码0即可。例如:
ang=110, eng=310, ing=410, ong=210;
ian=870, iao=820;
uai=940, uan=970, van=610;
iong=690,iang=890 , uang=990。
解决了声母和韵母的唯一编码,汉语拼音音节就能够准确、快速拼写输入,与普通单键输入一样,无须首先考虑字母的位置。
例如:“两liang”输入08 89,不用考虑重码,而普通单键组合拼写:54264(重音jiang liang ),此时,音节重码通过光标人工选择。
3、由于汉语拼音音节少,固有的同音字重码需要合理离散。根据手机自身的特点,最简易的办法是在单音节编码之后,允许使用笔画辅助码,笔画辅助码分为九种,包括:横(提)、竖(竖钩)、撇、点(捺)、折(折交),横交、竖交、撇交、捺交。
例如:梁liang=08 89, 两Liang=08 89;补首次笔:08 89 44,08 89 12
双shuang=98 99,爽shuang=98 99;补首次笔:98 91 59,98 91 68
与普通单键全拼相比,同样6码长,可以包容全拼音节和首、次笔画,其中首、次笔有9*9共81种类型,同音重码分辨率扩大81倍,同音字得到了最简单、有效的离散,提高了编码效率。
三、结合软件的智能化和人性化增强实用性
在高效率的编码系统之上,结合手机需求特点,综合软件智能化与人性化处理,效果“事半功倍”。
1、智能化字词关联预测,无需输入全码,缩短输入过程,提前命中目标;
2、兼容流行习惯,用户无需首先考虑字母排列位置,单击字母所在数字键完成音节拼写输入,完全不用区分重码音节;
3、模糊检索方式下多个音节的汉字同时返回,按字频高低显示,同时允许光标选字与长按键选字。
四、小结
1、简单运用9键位汉语拼音字母键位设定和汉语拼音韵母两码数字化,解决了对所有音节拼写准确快速输入只需1—4键,可选笔画补码可以有效区分同音字,拼写输入过程手机屏幕简洁,无需光标选择,思维单纯连续,简约高效。
2、各音节输入一般只需3-4键,成为4码快拼,输入过程自然流畅,真正符合音码的“想打”规律。
3、基于高效率的编码系统,可不依赖复杂的软件处理,最大限度节省资源,适应于8位机以上所有硬件环境之上。
4、字母音节与数字编码唯一对应,数字音节编码具有可阅读性,可运用于无字库终端跨平台网络传输或直接数字通信;适用于汉字信息的数字化音序分类排序和字典检索。
数字拼音快拼快检技术可使得数字键盘汉字拼音输入法以拼音零重码指标通过ESI《国家标准符合性检测》测试。
(作者单位:河南省内黄县田氏镇人民武装部 邮编:456361)
参考文献:
1. 黄北成:《快速拼写无重码数码拼音输入法》。
2. 刘学中:《数字音笔组合输入法及键盘》。