阅读文章

简易双拼,声韵并击,与形声码 ——汉字编码优化升级的三措施

[日期:2015-02-26] 来源:  作者:启文 [字体: ]

简易双拼,声韵并击,与形声码,是汉字编码优化升级的三措施。

三措施优化的重点有两个,一是提高输入速度,二是改善编码的学习性能。

其中,简易双拼是一种最简单的编码,也最容易实施。主要用于手机,比现有的双拼码容易学习,而输入速度相近。

三措施中的形声码,是简易双拼的升级版,主要用于PC机。

三措施中的声韵并击,是一种高速按键的方法,其速度目标是:

与简易双拼配合,输入速度快于现有的双拼码。与形声码配合,输入速度快于现有的形码。

一、简易双拼用于智能手机

现有的双拼码输入速度快,但键位记忆难。能否找到一种输入速度快,键位又容易记忆的编码?有的,这就是简易双拼。

1、关于简易双拼

简易双拼所用的音节是简化音节。

音节简化的规则是,在原有的音节中,简单的音节一般都无需简化。但是,只要是在音节的中部位置上含有介母iu,ü”的,则一律把这些介母简去。

例如,原有的音节“nan”无需简化。但是原有的音节“niannuan”,因其中部位置上含有介母iu”,则一律把这些介母简去,变为“nan”。

经过系统地归纳合并,简易双拼拥有音节的数量,由简化前的400多个,减为281个。简易双拼的优点是,节省了音节中部介母的按键时间。缺点是,281个简化音节区分汉字的能力有些损失。

利用已有的统计资料可以算出,与400多个音节相比,281个简化音节区分汉字的能力损失不大。限于篇幅,这里不作过多的说明。

这一不大的损失能为简易双拼换来许多优点,利远大于弊(见后文)。

2、为什么说简易双拼是容易学习的

现有的双拼码学习难,难在键位记忆难,而简易双拼的键位是容易记忆的,对比如下。

我国的多数人,包括农村青年,并未受过qwerty序键盘的训练。对于他们来说,现有双拼码的21个声母,35个韵母,56个拼音单元,无规律地重叠在26个键位上,是很难记忆的。

经验证明,学习难是使用率的大敌,尽管现有的双拼码提速效果明显,仅仅是因为拼音单元多,键位记忆难,又把绝大多数人拒之门外。

简易双拼的键位是容易记忆的,可分声母表,韵母表两部分进行分析。

简易双拼所用声母表,即“b p m f  d t n l……”是按发音部位的规律排列的,人人能够背诵。据台湾大千式键盘的经验,在键盘上排列声母表是容易记忆的,“占有率极高”。(见网文“注音输入法,大千式键盘”。)

与现有的双拼码相比,简易双拼所用韵母的数量大幅度减少了,从35个韵母,减少为只有15个基本韵母(eo合占一个键位),韵母的数量少了,所用的键位当然容易记忆。

这里所说的基本韵母,相当于注音字母中的单韵母

3、简易双拼用于智能手机

简易双拼用于智能手机,为了使屏幕上的按键空间变得更加宽绰,我们可以采用声母表,基本韵母表,轮流在屏幕上呈现的方法输入汉字。

就是说,在每次按键之后,屏幕上的声母表,或基本韵母表都能自动地切换。依据“声母,韵母,声母,韵母……”的顺序按键。并在每次按键之后,都能对应出相应的选字框,或选词框,可随时在框中进行选字,或选词。

在智能手机上,简易双拼的输入速度与现有的双拼码相近。

二、简易双拼配声韵并击

声韵并击是一种节约的按键方法,主要用于PC机。

所谓的声韵并击,就是把汉语拼音的21个声母,15个基本韵母,分片排列在键盘的左右两个片区。一手专司声母,一手专司韵母,两手并击,同时完成一个音节的输入。

后来在网上发现,这种声韵并击早就在大千式键盘上应用了。大千式因为声韵并击,能够“加快输入速度”。再加上键盘上排列的是人人能够背诵的注音字母表,避免了键位的“大海摸针”,在台湾“占有率极高”。

在大千式的键盘上,注音字母的声母表是以句为单位竖向排列的。优点是,能够由声母的发音部位,得知该声母的键位是由哪个手指分管的,有利于键位的记忆。——汉语拼音与注音字母声母表的排列相同。

与大千式不同的是,我们的声韵并击,声母表应该置于键盘的右侧。理由是,声母的数量多,手指的活动范围大,由灵活的右手分管,利于提速。

1、声韵并击特惠汉语的机理

本来,在声韵分离的键盘上,声韵并击是有信息量损失的。

如果不计下述两种音节频率上的差别,每声韵并击一次,就损失一比特的信息量。这一比特的信息量,是能够区分声母,韵母顺序的信息量。

举例来说,即在并击之后,不能确定并击的究竟是“fota”,或是“ofat”两种音节中的哪种音节了,这在英语中是不允许的。

但是在汉语中,只有“fota”一种音节,根本就用不着区分声母,韵母的顺序。

所以,在声韵分离的键盘上,声韵并击用于汉语,有节约时间的收益,而失去的却是没有什么用处的信息量。

由于在汉语拼音中,除了极少量没有声母的音节之外,几乎所有的音节都是前声后韵的音节,所以声韵并击的频率非常高,提速效果明显,声韵并击将是汉字键盘的大方向。

对此,大千式能够“加快输入速度”,“占有率极高”,是强有力的实战证据。

2、重排基本韵母序

声韵并击的提速效果明显,而汉语拼音与注音字母一脉相承,所以,在原理上,汉语拼音也是能够声韵并击的。

而且汉语拼音还有一个有利于声韵并击的因素,那就是,汉语拼音的声母表,即“b p m f  d t n l……”是有规律的,而且人人能够背诵。

汉语拼音不利于声韵并击的因素有两个,第一个不利因素是,汉语拼音基本韵母的排序,即“a o e ai ei ao ou……”,多数人对此是陌生的。

这不完全是坏事,既然对原有的排序是陌生的,不如趁此机会,按照使用频率,按照手指的灵活程度,重排15个基本韵母的排序。

代价是,人们必须花费几个小时,或一两天的时间记忆这一新的排序。

额外的收益是,新的排序是按照频率排序的,有额外的提速效果。

3、简易双拼对声韵并击的特殊贡献

简易双拼对声韵并击有特殊贡献,表现为以下两点。

第一点,汉语拼音有第二个不利于声韵并击的因素,简易双拼能够化解这一不利因素。把汉语拼音的不宜声韵并击,变为能够声韵并击。

这一不利因素是,汉语拼音的介拼韵母(即介母与基本韵母相拼组成的韵母)共20个,其中的五个产生了变体,这五个变体是不能声韵并击的。但是简易双拼能对这五个变体起到正本清源的作用,把它们还原成能够声韵并击的基本韵母。

例如,“ui”和“ing”都是介拼韵母的变体,若不简化,因键盘上只有基本韵母,没有“ui”和“ing”的键位,无处按键。而简化后分别被还原成基本韵母“ei”和“eng”,键盘上有相应的键位,是可以声韵并击的。

第二点,简易双拼简化了声韵并击的动作,容易熟练,熟练的结果是能提速。

作为对比,大千式的声韵并击,遇到中部含有介母的音节,负责韵母的那只手,需要同时动用两个手指,即一个手指寻找所需的基本韵母的同时,另一手指还要寻找所需的介母,并同时按下。这样的并击动作是有些难度的,用于专业打字是可以的,却不大适宜大众的熟练。

而简易双拼用于声韵并击,省去了相应音节中部介母的按键,两只手都是仅有一个手指在自己分管的键位上有按键动作,这样的声韵并击动作简单,有利于大众的熟练。

前文中曾经说过,简易双拼有许多优点,这里我们把这些优点汇总如下。

第一,简易双拼所用声母表,韵母表的键位容易记忆。

第二、简易双拼把汉语拼音的不宜声韵并击,变为能够声韵并击,提速效果明显。

第三、简易双拼简化了声韵并击的动作,容易熟练。

4、简易双拼配声韵并击的速度估计

PC机上,简易双拼配声韵并击,会有很快的输入速度。

方法是,第一次并击后,对应出简化音节的选字框,第二次并击后,对应出双音节词的选词框,……。每次并击后,都可以随时单击空格键,或数字键进行人工选字,或选词,也可以继续并击。

选字,或选词用的序号,可以像原来一样,使用空格键加阿拉伯数字,还可以尝试使用空格键加人们熟悉的b p m f……”序的声母。优点是,声母键都在右手的手指底下,选字更方便。

因为有了声韵并击,简易双拼的输入速度会明显地快于现有的双拼码。

三、形声码配声韵并击

简易双拼的长项是容易学习,并有不错的输入速度,缺点是,只有音节部分是可以盲打的,而选字过程是不能盲打的,这会降低输入速度,增加出错的几率。

形声码是简易双拼的升级版,是在简易双拼的基础上,增加不多的学习时间,换取更快的输入速度。

PC机上,形声码配声韵并击,有望成为一种专业型的汉字输入法。

1、简化的,拼音化的形声码

本文所说的形声码,是一种简化的,拼音化的形声码。

形声码的称谓,仿照的是形声汉字的称谓。在形声汉字中,形旁的任务是为声旁区分同音字,而在形声码中,形旁的任务是为声旁除重码,二者的任务性质是类似的。

形声码的声旁,记录的是汉字的音。在这里,声旁是简化音节,与简易双拼所用的简化音节是相同的。

形声码中形旁的定义是,利用拼音化的名称,记录了某一大类事物共性的部件。例如,“niao——鸟字旁”, “cao——草字头”等

形声码的形旁是极简形旁,产生办法是,把音节的韵母都简去,只保留声母做形旁。例如,把“niao”简化成“n”,把“cao”简化成“c”。

由于汉语的声母有21个,加上“yw”,形声码的极简形旁总共有23个。

极简形旁位于简化音节的后面,它们的任务是,通过高速盲打,取代不能盲打的人工选字过程,为简化音节除重码。

2、极简形旁容易学习的原因

我们说极简形旁容易学习,原因有两个。

第一,近八成的汉字有现成的形旁,且大部分名称准确,边界清晰,共性明显。如“你,俺,他”中的“人字旁”,可以直接简化成极简形旁“r”,这样的极简形旁是可以大量记忆的。

第二,有两成多的汉字没有形旁(多为独体字),它们的编码也需要配置极简形旁。

依据形旁的产生和配置规则,作者为这些汉字的编码试配了极简形旁。经验证明,只要事物的大类设置合理,编码的极简形旁也是容易记忆的。

例如,“我,自,己”的极简形旁均为“r”,简化自“ren——人称代词”。又如,“一,二,千,多,少,乘”的极简形旁均为“sh”,简化自“shu——数学用字”。再如,“东,西,上,下,左,右”的极简形旁均为“f”,简化自“fang——方位字”。这样的极简形旁也是容易大量记忆的。

3、极简形旁的四大大优点

无论是现有拼音码中选字用的序号,或者是大千式中的声调符号,它们的任务与极简形旁一样,都是用以为音节除重码。但是,极简形旁的优势明显,有四大优点。

第一大优点,记住的部件是可以高速盲打的。而极简形旁容易学习,在编码中是可以大量记忆的部件,见上一节。

作为对比,现有拼音码选字用的序号既无音,又无义,与电报码中的数字一样,都是无法大量记忆的部件。由于记不住,只能用以在屏幕上现看字,现选字,这是破坏盲打的过程,是拖累现有拼音码输入速度的主要因素。

第二大优点,极简形旁仅需单击一次,却极少重码字,见后文第5节。

第三大优点,由于简化音节都是有韵母的,而极简形旁都是没有韵母的,可以由计算机自行辨认输入的究竟是简化音节,或者是极简形旁。

第四大优点,极简形旁动用的是声母键,没有增加按键的数量。

作为对比,若用声调符号除重码,必须设置四个声调符号键。若用数字序号除重码,必须动用数字键,空格键,加上翻页键,占用的键位会更多。

4、设置一级码

一级码是略去了形旁的的编码,设置一级码是为了提速。

一级码是这样产生的,在每个简化音节的同音字中,只允许使用频率最高一个汉字使用一级码。由于简化音节只有281个,所以一级码最多也只能有281个。

而其余的编码则既有简化音节,又有极简形旁,这样的编码称之为二级码。

由于一级码对应的都是高频汉字,所以,一级码尽管只有281个,仍然有明显的提速效果。(原理上,大千式也可以设置一级码,但是网文没提。)

设置一级码是有代价的,这代价是,每个(简化音节的)同音字中哪个汉字是一级码,是需要记忆的。

——由于一级码的数量少,容易记住。限于篇幅,这里不予详细解释。

由于极简形旁只有声母而没有韵母,所以,声母的使用频率更高些。这也需要由灵活的右手分管声母片区,对提速是有益的。

5、形声码的重码率问题

形声码使用了简化的音节,又使用了极度简化的极简形旁,简化的优点是能够提速,代价是重码率增加了。那么,形声码的重码率有多大?

答案是,远小于大千式音节加声调符号的重码率。二者的几组数据对比如下。

1)大千式

汉语音节有400多个,加上五种声调符号(含轻声),二者相乘,理论上能够组成不同标调音节的最大数量是2000个。

其中,有同音汉字的标调音节只有约1300个,约占2000个音节的65﹪。反过来说,标调音节的无重码出字范围也只有约1300字。

2)、形声码

在形声码中,简化音节为281个,极简形旁23个,二者相乘,理论上二级码的最大数量是6463个。

其中,无重码的出字范围有多大?且不说是65﹪,即便是按50﹪计算,二级码无重码的出字范围仍然有3231个。再加上一级码281个,那么最大的无重码出字范围为3512个,标调音节无重码的出字范围约1300字,3512字是它的2.7倍。

据网上的数据,毛主席公开出版的全部著作“也仅用单字3136个。”由此估计,普通人群日常写作的用字范围大多在3000字以内。

无重码的出字范围是一个非常重要的量,预计约3000字,就可以盲打。

由此可以断定,形声码是可以盲打的。3512字之外再出现重码时,需要选字,但发生的几率,及其对输入速度的影响,都是非常小的。

6、形声码的学习性能估计

形声码的主体部件是简化音节,占了形声码的大部分。辅助部件是极简形旁,只占形声码的小部分。

形声码的学习性能分别由这两个部件的学习性能,及哪些汉字是一级码的学习性能,共三部分组成的。

第一部分,形声码的主体部件,也就是形声码的大部分是非常容易学习的。原因是,音节是拼音码中最容易学习的部件,因为在汉字形音义的三种知识中,音是人们最熟悉的知识,这也是拼音码为什么始终在汉字编码中占主流的原因。而且,现有的音节简化为简化音节利用的是简单规则,也不会增加学习负担。

第二部分,如第2节所述,极简形旁也是容易学习的。

第三部分,关于哪些汉字是一级码的记忆,类似的记忆在现有的形码中也是存在的。

结论是,与现有的形码相比,形声码是更容易学习的编码。

7、形声码的输入速度估计

PC机上,形声码配声韵并击,二者更是强强联合,提速优势更为明显。

形声码中的一级码约281个。利用汉字频率表统计,281个一级码的合计频率约为0.48

对于281个没有形旁的一级码,只需一次声韵并击就可以出一个高频汉字。

对于281个之外的,有形旁的二级码,一次声韵并击可以出一个简化音节,一次单击声母可以出一个极简形旁,只需一次并击,一次单击就可以出一个低频汉字。

容易计算,平均每个汉字仅需并击一次,单击0.52次,而且重码少,可盲打。因为有了声韵并击,输入速度将会超过现有的形码。

8、下一步的提速设想

第一项措施是按照频率重排声母序,有明显的提速效果。缺点是人们需要花费时间记忆新的声母序。

另一项措施是根据汉语的声母,加基本韵母多的事实(二者合计为36个),增加键盘按键的数量,并按照汉语声母、韵母的拼音特点改进键盘。在这种键盘上,形声码配声韵并击,输入速度会更快。

在键盘上增加按键的数量,可做今后的任务,或由企业自行优化,由市场进行选择。




阅读:
录入:hzipy

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:中国人占世界人口的比例应二分之一

下一篇:法国伏尔泰:在欧洲,我们没有一个民族
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章