阅读文章

简易双拼,声韵并击,新键盘,形声码

[日期:2015-04-10] 来源:  作者:启文 [字体: ]

简易双拼,声韵并击,新键盘,形声码

——关于双拼码,输入法的几点改革与创新

启文

现有的双拼码输入速度快,瓶颈是键位记忆难。

简易双拼是双拼码的轻度简化形式,用于智能手机,最大的优点是容易学习,也容易实施。远比现有的双拼码容易学习,而输入速度相近。

声韵并击是一种在PC机上高速按键的方法,其速度目标是:与简易双拼配合,输入速度快于现有的双拼码。与形声码配合,输入速度快于现有的形码。

而多种新键盘,是适应市场的不同需求,为PC机的汉字输入锦上添花。

一、关于简易双拼

简易双拼所用的音节是轻度简化的音节。

简化的规则是,原有的简单音节一般无需简化。但是,只要是在音节中部的任一位置上含有介母“i,u,ü”的,则一律把这些介母简去。

例如,原有的音节“nan”无需简化。但是原有的音节“nian,nuan”,因其中部位置上含有介母“i,u”,需要把这些介母简去,一律变为“nan”。

简易双拼的优点是,节省了音节中部介母的按键过程。缺点是,简易双拼的音节数量,由简化前的400多个减为281个,由此导致的重码率有所增加。

表面看来,优缺点是持平的,但后文能够证明,简易双拼的利远大于弊。

1、为什么说简易双拼是容易学习的

简易双拼的键位是容易记忆的,原因有两个。

第一,简易双拼使用的声母表,即“b p m f  d t n l……”,是有规律的,人人能够背诵。而且,以句为单位竖向排列的声母表,对于键位的记忆有双重帮助。——见后文“多种新键盘”一节。

第二,与现有的双拼码相比,简易双拼所用韵母的数量大幅度减少了,从35个韵母,减少为只有15个基本韵母(e,o合占一个键位)。韵母的数量少了,所用的键位当然容易记忆。——这里的基本韵母,相当于注音字母的单韵母

反观现有的双拼码, 21个声母,35个韵母,56个拼音单元,无规律地重叠在26个键位上,是很难记忆的。

经验证明,学习难是使用率的大敌,现有的双拼码速度快,仅仅是键盘上的键位记忆难,又把绝大多数的人们拒之于门外。

2、简易双拼用于智能手机

简易双拼既能用于PC机,也能用于手机,有多种用法。限于篇幅,这里只谈智能手机的一种新颖用法。

在智能手机上的屏幕上,为了使按键空间变得宽绰,我们可以采用声母表,基本韵母表,轮流在屏幕上显示的方法输入汉字。

具体地说,在每次按键之后,屏幕上的声母表,或基本韵母表都能自动地切换。依据“声母,韵母,声母,韵母……”的顺序按键。并在每次按键之后,都能对应出相应的选字框,或选词框,可随时在框中进行选字,或选词。

在智能手机上,简易双拼的输入速度与现有的双拼码相近。

二、简易双拼配声韵并击

声韵并击是一种高速按键的方法,适用于PC机。由于提速效果明显,声韵并击将是汉字键盘的大方向。

所谓的声韵并击,就是把汉语拼音的21个声母,15个基本韵母,分片排列在键盘的左右两个片区。一手专司声母,一手专司韵母,两手并击,同时完成一个音节的输入。

后来发现,这种方法早就在台湾大千式键盘上应用了。大千式因为声韵并击,能够“加快输入速度”,再加上键位容易记忆,市场“占有率极高”(网文:注音输入法,大千式键盘)。

与大千式不同的是,我们的声韵并击,声母表置于键盘的右侧。理由是,声母的数量多,手指的活动范围大,由灵活的右手分管,利于提速。

1、声韵并击与汉语是适配组合

本来,在声韵分离的键盘上,声韵并击是有信息量损失的。

如果不计下述两种音节频率上的差别,每声韵并击一次,就损失一比特的信息量。这一比特的信息量,是能够区分声母,韵母顺序的信息量。

举例来说,在并击之后,不能确定并击的究竟是“fota”,或是“ofat”两种音节中的哪种音节了,这在英语中是不允许的。但在汉语拼音中,只有“fota”一种音节,根本就用不着区分声母,韵母的顺序。

由于汉语拼音几乎所有的音节都是前声后韵的组合,所以,声韵并击的频率极高,提速效果极为明显。可以说,声韵并击将是汉字输入的大方向

2简易双拼对声韵并击的特殊贡献一

汉语拼音有一个不利于声韵并击的因素,简易双拼能够化解这一不利因素。把汉语拼音的不宜声韵并击,变为能够声韵并击。

这一不利因素是,汉语拼音的介拼韵母(即介母与基本韵母相拼组成的韵母)共20个,其中的五个产生了变体,这五个变体是不能声韵并击的。但是简易双拼能对这五个变体起到正本清源的作用,把它们还原成能够声韵并击的基本韵母。

例如,“ui”和“ing”都是介拼韵母的变体,若不简化,因键盘上只有基本韵母,没有“ui”和“ing”的键位,无处按键。而简化后分别被还原成基本韵母“ei”和“eng”,键盘上有相应的键位,是可以声韵并击的。

3、简易双拼对声韵并击的特殊贡献二

简易双拼能够简化了声韵并击的动作,容易熟练,熟练的结果是能提速。

作为对比,大千式的声韵并击,遇到中部含有介母的音节,负责韵母的那只手,需要同时动用两个手指,即一个手指寻找所需的基本韵母的同时,另一手指还要寻找所需的介母,并同时按下。这样的并击动作是有些难度的,用于专业打字是可以的,却不大适宜大众的熟练。

而简易双拼用于声韵并击,省去了部分音节中部介母的按键过程,两只手始终都是仅有一个手指,在自己分管的键位上有按键动作,这样的声韵并击动作是简单的,有利于大众的熟练。

前文说过,简易双拼的利远大于弊,这里我们把这些“利”汇总如下。

第一,简易双拼所用声母表,韵母表的键位是容易记忆的(见第一节)。

第二、简易双拼把汉语拼音的不宜声韵并击,变为能够声韵并击,提速效果明显。

第三、简易双拼简化了声韵并击的动作,容易熟练。

4、简易双拼配声韵并击的速度估计

PC机上,简易双拼配声韵并击,会有很快的输入速度。

方法是,第一次并击后,对应出简化音节的选字框,第二次并击后,对应出双音节词的选词框,……。每次并击后,都可以随时单击空格键,或数字键进行人工选字,或选词,也可以继续并击。

选字,或选词用的序号,可以像原来一样,使用空格键加阿拉伯数字,还可以尝试使用空格键加人们熟悉的b p m f……”序的声母。优点是,声母键都在右手的手指底下,选字更方便。

因为有了声韵并击,简易双拼的输入速度会明显地快于现有的双拼码。

三、多种新键盘

在中国,人们的文化背景千差万别。六十多岁的人学的是注音字母,年轻些的人们学的是汉语拼音。只有少数人接受过qwerty序键盘指法的训练,多数人未受过这种训练。再加上人们的工作不同,对键盘性能的要求也是不一样的,应该制造出性能各有侧重的多种新键盘,以适应市场的需求。

1、大千式键盘的经验与启迪

大千式键盘的经验是,在通用键盘上能够声韵并击,但有些勉强。

大千式键盘的启迪是,大千式的声母表,是以句为单位竖向排列的。依笔者的观察,这种排列对于键位的记忆有双重帮助。

第一重帮助,把人们能够背诵的任何一种字母表,包括声母表排在键盘上,对键位的记忆都是有帮助的。

第二重帮助,注音字母的声母表(与汉语拼音声母表的排序相同),是按发音的规律,以句为单位排列的,而大千式的声母表又是以句为单位竖向排列的。这种排列的效果是,在坐标的横轴上,能够由声母的发音部位,得知该声母是由哪个手指分管的。

——笔者按:如果再做一点改进,把每句的上端声母对齐。对齐后的效果是,在坐标的竖轴上,能够由声母发声时的送气方式,得知该声母是位于哪一行的。

显然,这种关系对于键位的记忆有额外的帮助。

——反观现有的拉丁字母表,无论是“a b c d ……”序,或是qwerty序,即便是能够背诵,类似第二重的额外帮助都是没有的。

问题是,以句为单位竖向排列的声母表需要四行,而通用键盘的字母键只有三行。再加上通用键盘上的字母键位不够用,从网文的键盘图上能够看出,大千式声母表,韵母表的排列是很勉强的。

2、市场的多种需求

中国有多种编码在使用,原因是一些人看重“学得快”,一些人看重“打得快”。键盘也是一样,除了通用键盘外,还应制造性能各有侧重的多种新键盘,也是会受到市场欢迎的。理由如下。

第一,在我国,电脑已经走出知识阶层,普及到千家万户。其中多数人,包括农村青年,并未受到qwerty序键盘指法的训练。只要设法使新键盘明显地比通用键盘容易学习,是能够受到这些人的欢迎的。

第二,通用键盘的字母键只有26个,据说还有七个备用键,而汉语的声母加基本韵母共36个,仍然缺少三个键。与亚伟速录机相比,通用键盘对拇指的利用是很不充分的。而汉语的36个键,需要拇指发挥更多的作用。

第三,对于那些更看重速度的人们,还可以考虑按照使用频率,和手指的灵活程度,重排声母序和韵母序,优点是提速效果明显。缺点是需要花费时间记忆新的排序。

结论是,既然人们的文化背景千差万别,一些人看重“学得快”,一些人看重“打得快”,那么,根据汉语的特点,设计出性能各有侧重的多种键盘,是会受到市场欢迎的。

大千式键盘说不上完美,但“占有率极高”,是个强有力的实战证据。

四、形声码配声韵并击

简易双拼的长项是容易学习,并有不错的输入速度,缺点是,只有音节部分是可以盲打的,而选字框选字过程是不能盲打的,这会降低输入速度,增加出错的几率。

形声码是简易双拼的升级版,是在简易双拼的基础上,增加不多的学习时间,换取更快的输入速度。

在PC机上,形声码配声韵并击,有望成为一种专业型的汉字输入法。

1、简化的,拼音化的形声码

本文所说的形声码,是一种简化的,拼音化的形声码。

首先说明,人们常说的形声码,其中的“形”指的往往是汉字的书面形体。

而在本文中,形旁的定义是,利用拼音化的名称,记录了某一大类事物共性的部件。如,“niao→鸟字旁→鸟类共性”, “cao→草字头→草类共性”等

——本文所说形声码中的“形”,与形声汉字中的“形”,不但二者的本义是相同的,而且任务也是类似的。在形声汉字中,形旁的任务是为声旁区分同音字,而在形声码中,形旁的任务是为音节除重码。

形声码中的声旁,也就是简化音节,与简易双拼所用的简化音节是相同的。

形声码中的形旁是极简形旁,产生办法是,把音节的韵母都简去,只保留声母做形旁。例如,把“niao”简化成“n”,把“cao”简化成“c”。

由于汉语的声母有21个,加上“y,w”,形声码中的极简形旁总共有23个。

极简形旁位于简化音节的后面,它的任务是,通过高速盲打,取代不能盲打的选字框选字过程,为简化音节除重码。

2、极简形旁容易学习的原因

极简形旁是容易学习的,原因有两个。

第一,近八成的汉字有现成的形旁,且大部分名称准确,边界清晰,共性明显。如“你,俺,他”中的“人字旁”,可以直接简化成极简形旁“r”,这样的极简形旁是可以大量记忆的。

第二,有两成多的汉字没有形旁(多为独体字),它们的编码也需要配置一个极简形旁。

依据形旁的产生和配置规则,作者为这些汉字的编码试配了极简形旁。经验证明,只要事物的大类设置合理,编码的极简形旁也是容易记忆的。

例如,“我,自,己”的极简形旁均为“r”,简化自“ren人称代词”。又如,“一,二,千,多,少,乘”的极简形旁均为“sh”,简化自“shu数学用字”。再如,“东,西,上,下,左,右”的极简形旁均为“f”,简化自“fang方位字”。这样的极简形旁也是容易大量记忆的。

3、极简形旁的四大大优点

无论是现有拼音码中选字用的序号,或者是大千式中的声调符号,它们的任务与极简形旁一样,都是用以为音节除重码。但是,极简形旁的优势明显,有四大优点。

第一大优点,记住的部件是可以高速盲打的。而极简形旁容易学习,在编码中是可以大量记忆的部件,见上一节。

作为对比,现有拼音码选字用的序号既无音,又无义,与电报码中的数字一样,都是无法大量记忆的部件。由于记不住,只能在选字框中现看字,现选字,这是破坏盲打的过程,是拖累现有拼音码输入速度的主要因素。

第二大优点,极简形旁仅需单击一次,却极少重码字,见后文第5节。

第三大优点,由于简化音节都是有韵母的,而极简形旁都是没有韵母的,可以由计算机自行辨认输入的究竟是简化音节,或者是极简形旁。

第四大优点,极简形旁动用的是声母键,没有增加按键的数量。

作为对比,若用声调符号除重码,必须设置四个声调符号键。若用数字序号除重码,必须动用数字键,空格键,加上翻页键,占用的键位会更多。

4、设置一级码

一级码是略去了形旁的的编码,设置一级码是为了提速。

一级码是这样产生的,在每个简化音节的同音字中,只允许使用频率最高一个汉字使用一级码。由于简化音节只有281个,所以一级码最多也只能有281个。

而其余的编码则既有简化音节,又有极简形旁,这样的编码称之为二级码。

由于一级码对应的都是高频汉字,所以,一级码尽管只有281个,仍然有明显的提速效果。(原理上,大千式也可以设置一级码,但是网文没提。)

设置一级码是有代价的,这代价是,每个(简化音节的)同音字中哪个汉字是一级码,是需要记忆的。

——由于一级码的数量少,这一记忆量不大。限于篇幅,这里不予详细解释。

由于极简形旁只有声母而没有韵母,所以,声母的使用频率更高些。这也需要由灵活的右手分管声母片区,对提速是有益的。

5、形声码无重码的出字范围

形声码无重码的出字范围是个非常重要的量,这一范围过大,会有多余的按键过程,会降低输入速度。这一范围过小,会增加选字框选字的几率,也会降低输入速度。

形声码的简化音节为281个,极简形旁23个,二者相乘,二级形声码的无重码出字范围理论上最大为6463字。那么,该范围实际上有多大?可以参考大千式的一个比例。

汉语音节有400个,有五种声调符号(含轻声),二者相乘,大千式的无重码出字范围理论上最大为2000字。由于汉语中的标调音节只有1300个,所以大千式无重码的出字范围实际上也是1300字,约占2000字的65﹪。

前文说过,二级形声码的无重码出字范围理论上最大为6463字。且不说是按65﹪的比例计算,即便是按50﹪估算,也有3231字。再加上一级码281字,形声码无重码的出字范围实际上约为3512字。

另据网上的数据,毛主席公开出版的全部著作“也仅用单字3136个。”由此估计,普通人日常写作的用字范围(即会写的字数),大多在3000字以内。

可以说,形声码无重码出字范围的大小是非常适宜的,而且还是可以盲打的。仅仅是那些同音字特别多,又不大会写的陌生字才可能有重码,才需要选字框选字。但发生的几率,及其对速度的影响,都是非常小的。

6、形声码的学习性能估计

形声码的主体部件是简化音节,占了形声码的大部分。辅助部件是极简形旁,只占形声码的小部分。

形声码的学习性能分别由这两个部件的学习性能,及哪些汉字是一级码的学习性能,共三部分组成的。

第一部分,形声码的主体部件——简化音节部分是非常容易学习的。原因是,在汉字的形音义三种知识中,音是人们最为熟悉的知识,这也是拼音码的用户始终占优势的主要原因。

而且,全拼音节变为简化音节,依据的是简单规则,也不会增加学习负担。

第二部分,如前文所述,极简形旁也是容易学习的。

第三部分,关于哪些汉字是一级码的记忆,类似的记忆在现有的形码中也是存在的。

结论是,与现有的形码相比,形声码是更容易学习的编码。

7、形声码的输入速度估计

在PC机上,形声码配声韵并击,二者更是强强联合,提速优势更为明显。

形声码中的一级码约281个。利用汉字频率表统计,281个一级码的合计频率约为0.48。

对于281个没有形旁的一级码,只需一次声韵并击就可以出一个高频汉字。

对于281个之外的,有形旁的二级码,一次声韵并击可以出一个简化音节,一次单击声母可以出一个极简形旁,只需一次并击,一次单击就可以出一个低频汉字。

容易计算,平均每个汉字仅需并击一次,单击0.52次,而且重码少,可盲打。因为有了声韵并击,输入速度会超过现有的形码。

 




阅读:
录入:gbh123

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:也探究一下“辅车相依”

下一篇:《不规范汉字三字经》
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章