1、基础码判断准则
汉字可以用字形或字音编码,用字形编码的叫形码,用字音编码的叫音码,无论形码还是音码都存在着基础码,分别称作基础形码和基础音码,基础码判断准则如下:
一、是否与国际接轨;
二、是否涵盖所有汉字;
三、是否携带汉字全部信息。
基础码有如下特征:
一、只有基础码才得以普及,而除此之外的所有汉字编码,它们的使用都有局限性,只能在部分人群中推广;
二、基础码并不是输入速度快、重码最少的汉字编码;
三、至少有一种音形码(或形音码),其只携带基础音码和基础形码的主要信息,形成一种简便、高效率、大容量,能被大多数人接受和普及的汉字编码。
2、基础码判断准则的验证
汉语拼音是基础码,输入效率低重码也多却得以普及,而简拼和双拼不是基础码,功能再好也不能得到普及;在形码中,因为五笔字型不是基础码,在初创时期市场占有率只占计算机中文录入人员的百分之五,经过二十多年推广,使用者虽然在不断增多,但市场占有率始终没有多大改变;在音形码(或形音码)中,二笔输入法从2000年初开始全面推广,虽然码长短、重码率低,因为没有基础形码的参与,因此不能被大多数人接受;因为基础形码尚未面世,所以至今也没有哪一种方法能够在汉字输入中独占鳌头。
3、基础形码存在的依据
基础码判断准则是笔者结合中国二十多年汉字编码实践,深入挖掘汉语拼音方案内涵总结出来的,因此汉语拼音是基础音码,这里将汉语拼音基本特征外延,目的是为了寻找基础形码,那么基础形码是否存在呢?我们能够找到基础形码吗?
汉字具有形、音、义三要素,在汉字编码中,采用字形编码与采用字音编码具有等价关系,既然字音与拉丁字母相结合能产生汉语拼音方案,那么字形与拉丁字母相结合就应该能产生汉语拼形方案,根据等价关系还能进一步推测:
1)汉语拼形方案与汉语拼音方案应具有相同的定义,只是所叙述的对象分别在形码领域或音码领域;
2)汉语拼音方案是音码中的基础码,汉语拼形方案就应该是形码中的基础码。
4、汉语拼形方案初探
汉字具有字音及字形,字音与国际接轨采用多字母表示,这就是汉语拼音方案,表明最初汉语拼音与汉字只是近音,后定为标准音,下面试从近音角度为汉语拼音定义:根据近音原理将汉字无调音节分析出的音素用字母A—Z表示,这种字母称作汉语拼音字母,并把汉语拼音字母按先后顺序排列构成的字母组合就称作汉语拼音。根据等价关系,字形也应该能与国际接轨采用多字母表示,这就是汉语拼形方案,下面试从近形角度为汉语拼形定义:根据近形原理将汉字按笔顺规则表分析出的单笔或多笔画结构用字母A—Z表示,这种字母称作汉语拼形字母,并把汉语拼形字母按先后顺序排列构成的字母组合就称作汉语拼形。
汉语拼形方案是根据等价关系从汉语拼音方案推求出来的,因此具有汉语拼音方案的基本特征,下面根据汉语拼音方案来推测汉语拼形方案的基本特征:
1)汉语拼音方案采用拉丁字母和计算机标准键盘,早在1958年就已经与国际接轨;因此汉语拼形方案也是采用拉丁字母和计算机标准键盘。
2)汉语拼音方案涵盖了所有含音字,汉语拼形方案涵盖了所有含形字,它们之间的关系是:后者包括所有方块字,而前者只是其中400多个无调音阶所构成的字(有些字符有形而无音),可见汉语拼形方案复盖面要大于汉语拼音方案。
3)汉语拼音方案是全息码,携带了汉字的全部字音信息,重码多、输入效率也不高;汉语拼形方案也是全息编码,多一笔和少一笔都是不行的,由此可断定直接采用汉语拼形方案输入汉字,重码也要多,输入效率肯定也是不会高的。