湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

汉字输入技术与应用研讨会论文集

 

形码类输入法的特点及汉字编码发展探讨

  

魏立钦

  

《河南工人日报》社

 

 

一、形码类输入法的特点和比较

1、现有形码类输入法的分类及其特点

现前流行的形码类输入法(以形为主的编码方案,包括形码、形音码、音形码),有字根式和笔画式两种方式,字根式主要是依汉字的构字部件来给汉字编码,笔画式是依据汉字的笔画来给汉字编码。

字根式存在的问题是:如何把字根归组并定义到键位?它分为有“音托”和“形托”两种不同的方案。“音托”是依字根读音来归组定位,这会产生如字根无读音或读音脱离大众背景知识的弊端;“形托”是以字根之间形似及某些字根与拉丁字母之间形似来归组(如口似O,丁似T),字母和字根的形似毕竟是特殊,所以有相当一部分字根和字母结合显得牵强附会。而且,音托和形托共同的难题是:在原则唯一的情况下分散重码,上述难点和麻烦造成字根输入法既有共性——按字根拼合输入,千差万别——字根选取不一、归组不一、定位不一、键位不一、编码原则不一等等。

笔画式输入法是选取汉字的基本笔画(五种或八种),把笔画定义到汉字的数字键和字母上,然后依笔顺或汉字的笔顺来给汉字编码, 这就存在着笔顺不对而打不出汉字的麻烦。一些字根式输入方法也常常用笔画信息来定义字根或汉字编码,一些笔画式方法也常常是把汉字分解成字根后来进行编码。此外,汉字的字形结构(左右结构、上下结构、包围结构)信息也被一些字根式输入法采用。

2、方位式输入法的特点:

除了字根式和笔顺式的编码方法外,我们可以换一个角度来思考:汉字俗称为方块字,汉字的四角是固定的,汉字按角的形状编码则具有直观性的特点。利用四角号码的原理,依汉字的四角顺序(如按照左上角、右上角、左下角、右下角顺序)来编码,相比较按字根式和笔顺式编码容易,笔者把这种方法称为方位式输入法。其实已经推出的输入法有不少就是参照四角号码进行设计的,如早期的王安三角码、层次四角、纵横码、首尾码、轻松输入法(台湾),以及后出现的对角码等等,只是没有给出方位式编码一个明确的定义。

专家对四角号码的评价,“王云五的四角号码曾是早期的一种角形编码,它作为一种查字法是成功的。在过去,甚至现在一些字典里还延用,但是只用到0~9十个数字做码元,特征信息集过小,并在取形上只取外形,有太多的重码而妨碍了在电脑上广泛应用。” (引自《汉字键盘实用技术与理论基础》)

再看关于“层次四角”编码方案的评论,“(层次四角)以角形取较之按笔顺取形部件数较少,且易于特征提取(少数字例外),对于不好掌握笔顺的字,按角取形较之按笔顺要容易。(引自《汉字键盘实用技术与理论基础》)

总体说来,方位式汉字输入法比较字根式和笔画式输入法,汉字从外形上取角比依笔顺“拆分”直观形象。

 

三、结合实例(十笔字型系列输入法)探讨汉字编码的改革

 

1、宏观性原则

A、字根设计原则——“近形”原则

“人们在辨析其熟知的汉字时,并不是去精确地逐一去分析其笔画,而是近似地模糊地形成汉字映象,因此编码部件在键位上的分布,应采取近形这一原则。”

“(钱码)以其码长短,字根的模糊归类以及容错能力强等综合特点而形成了一个有影响的编码方案,对后来发展起来的一批键盘上以‘形托’方式分布字根的输入法起了先导或推动作用。”(以上两段文字为专家对钱码(钱伟长宏观字形编码)的评价,引自清华大学出版社出版《汉字键盘输入技术与理论基础》)。

“十笔字型计算机系列汉字输入技术”将角形(字根)划分为“横、垂、点(捺)、叉、穿、方、角、八、小、立(点横结合)”十种类型,根据“近形”这一原则,将角形(字根)归类,这10种类型的划分对汉字角形起定位作用。这种归类是以“宏观”入手,有别于“音托”的字根归类方式和以特殊字根来归类字根的“形托”方式。

十笔字型角形分类具有直观性、形象性、模糊性的特点,便于记忆。如 “口、日、田” 为“方”形的字根,位于普通键盘数字6对应的第6列。

B、编码设计原则——“模糊”原则

以往输入法大多是利用“拆分——组合”的方法,自成体系。当规则之间相互冲突时,就在规则之后做出一些补充规定。例如:“未”“末” 两字,将“未”拆分成“二丨八”,而将“末”拆分成“一木”。十笔字型中“未”“末”两字则按字根模糊归类原则均取“穿(一笔画穿两笔画)和小(‘小’字形状)。

十笔字型输入方法按角编码的方法,首次提出了当汉字笔画相互交叉时,断开取“断根”或“断笔”,取字的外形特征最为显著的一部分,即当遇到一些输入法不采用的字根时,用该字根的一部分来代替。如 “跑”字,在十笔音形码编码时,左上角取“口”字;而右下角“巳”字没有列在角形(字根)表中,“跑”尾角竖弯钩断开取断笔“横挑——”,同样,“笔”字的左下角也同样取断笔(横挑——)。

2、多元化原则

A、输入法从单一类型向普及型和专业型综合发展

“输入法只有结合形码和音码的长处,并且能够做到形码和形音码基于相同的编码方案和编码元素(字根和笔画),适合的人使用,才会有所突破”。(引自《电脑汉字键入实用手册》,化学工业出版社)。

以上这段话说明了汉字输入的综合发展方向。十笔字型系列输入法是基于同一编码方案的输入法,包括音形码、形音码、形码和数码四种方法。十笔字型的形码和形音码即是基于同一方案的输入法,形码为专业人员设计,按照左上角、左下角、右上角、右下角顺序取角(不同于四角号码按照左上角、右上角、左下角、右下角的编码顺序);形音码介于专业和普通用户之间的输入方法,编码按照左上角、右下角、拼音首字母的顺序;音形码则是面向普通用户,编码按照拼音首字母、左上角、右下角的顺序,四字以上词和短语取四字的拼音首字母即可,更为符合普通用户用拼音输入的习惯。

输入方案只有将音形码、形音码和形码相互统一起来,才能使汉字输入法显得更为科学。各种输入法之间相互可以查询编码,使用方便。

B、从单纯的字母键到字母键和数字键相互统一

十笔音形码将计算机键盘中 30个键分为10列,和10个数字键相对应;每一列又分为上中下3行,以中间一行为第1行,上面一行为第2行,下面一行为第3行,每一个字母就可以用两个数字表示,两个数字编码称为行列码。汉字的编码既可以用字母表示,也可以用数字表示。

3、系统化原则

A、按照由易到难、循序渐进的规律

“(输入法)不但满足不同用户不同水平的要求,还要满足同一用户在不同阶段的使用要求,也就是说输入法的结构是多层次的,这就是以易学为特点的初级阶段,用户可以不必通过培训班,借助辅导材料和电脑智能化来学习掌握……在初级阶段的基础上,通过继续练习,逐步地、自然地、迅速地过渡到最高级阶段,即适应各个行业的整体要求,对于那些以录入为职业的操作员,系统还应提供以高效率和高准确率为目标的环境,以达到具有节奏性、快速性的高级阶段”。(引自《汉字键盘编码输入文集》)

循序渐进、由易到难是十笔字型系列输入法设计遵循的原则。十笔音形码和十笔形音码适合于普通人员,用户可很快掌握十笔音形码,在指法熟练的基础上需要进一步提高速度,可在十笔音形码基础上多记一些字根,顺利过渡到十笔形音码,而专业打字员必须要求输入速度,在十笔形音码的基础之上学习十笔形码同样也很方便。

B、汉字编码方法向汉字输入系统发展

汉字编码输入方法将向汉字输入系统发展,形成繁简字配套,基本字集与全字集配套,字库词库配套,通用专用配套,输入方法(音码、形码、音形码)配套,汉字软件配套等一系列的配套措施。十笔字型系列输入法方案正在不断完善,努力成为一个完整的汉字编码输入系统。

4、实用性原则

A、实用性原则

输入法首先应考虑的是实用性。现有不少输入法自身强调规范化,提出“严格按照汉字笔顺”、“严格按照部首划分”或“严格按照字形结构”,看似规范,其实是把自己限制在划定的圈子里了。汉字键盘输入法是通过键盘敲击在电脑上输入汉字,目的是为了提高工作效率,它与用笔在纸上写字是两种不同方法。据报载,一个从来不认识字的老年盲人竟学会了五笔字型。这则报道从一个侧面反映了输入法和写字是可以分离的,是两个不同的概念。如同简拼输入法用一个字母来代表两个或两个以上的韵母,“简拼”只是专为键盘输入法提出的解决办法,和汉语拼音两者之间不可以等同起来。

只有让人去改变传统观念,而不能让传统观念来束缚人,汉字输入法才可能有进一步的改革和发展。二十多年来,汉字输入法几乎是五笔字型一统天下的局面,竟没有输入法能突破这个局限,可见汉字输入法要求“规范化”的这一观念,贻害无穷。笔者不是说输入法可以天马行空,弄出让人难以理解的方案来,而是希望编码设计者在实用的基础上兼顾直观。

B、易学性原则

对普通用户来说“易学”是占第一位,输入法要容易理解,速度提高快。对大多数普通用户来说,一种输入法盲目追求速度,让用户接受专门的培训,背诵码本,可谓是“谋财害命”。输入法能够让用户在最短时间掌握,利用电脑提高工作效率,满足输入要求,就可以了。对于使用方言区的用户来说,用拼音输入法效率低,能够很快地掌握一种“适合”的输入方法显得尤为重要。普通用户学输入法是为了日常办公需要,边想边打,达到每分钟四五十个汉字的输入速度就可以了,有的人每分钟只需输入二、三十个汉字就满足了日常工作需求。

有的输入法宣称每分钟最高速度能达到200多字,其实这是对消费者的一种误导。专职用户则速度是占第一位的,为了达到高速输入的目的,甚至可以不考虑易学性,接受专门的职业培训,这对于普通用户就完全不必要了。

 

结束语:

 

汉字输入法是小项目、 大市场,一个好的输入法不仅仅是个人使用方便的问题, 最主要的是降低用户时间成本,提高工作效率,给社会带来无法估量的社会和经济效益。对于输入法的研究者来说,经济利益需要考虑,社会利益更要考虑。输入法只有从社会责任的角度进行研究和推广,才可能有市场,才会有用户群, 最终才会有收益。笔者结合自己的研究, 提出以上的观点和看法,希望本文能够给输入法的研究和发展起到抛砖引玉的作用。

 

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有