阅读文章

汉字编码与互联网域名

[日期:2008-11-19] 来源:原创  作者:高国鹫 [字体: ]

湘潭市工业贸易中等专业学校/工贸学校/工贸中专/市一职招生简章

湘潭市工贸学校2019年招生简章(每年更新)

 

  前言

 

汉字编码自上世纪八十年代末诞生以来,经历了字处理阶段、词处理阶段、句处理阶段,未来汉字编码将由单一的输入功能向多功能演化,这是汉字编码的最高阶段,是汉字编码演化的必然趋势,实现这一目标是个里程碑,标志着中国汉字编码最终走向成熟。

笔者在《论汉字编码数学原理》一文中,提出了汉字编码三要素:汉字、构件、汉字码,在这里,汉字、构件属汉字文化范畴,那么汉字码属什么?根据汉字码定义:表示汉字的字母、数字及其它符号组合叫汉字码,因此汉字码属工具,目前汉字码的工具属性是单一的,就是为了用于输入汉字,将汉字编码由单一的输入功能向多种功能演化,就是要改造汉字码属性,让汉字码在汉字文化的不同领域扮演更多角色。

汉语拼音是汉字的辅助工具,所以直接采用汉语拼音编码,主要还是为了输入汉字,但汉语拼音在拼写专名等方面又表现出文化属性,另外采用英文编码构成的文字码也具有文化属性,而且这种文化属性要比汉语拼音强烈得多,从这里我们似乎得到启发,改造汉字码的属性,拓展汉字码的使用功能,这在实践上是可行的。

拓展汉字码使用功能,需要在汉字编码理论上的创新和制定新的规范标准来支撑。汉字编码理论上的创新,就是要坚持科学发展观,丰富和发展汉字编码理论。制定新的规范标准,会涉及当前国际标准化问题,如果国际标准领先时,我们要在国际标准下“中国制造”,但是,当国际标准滞后时,我们要考虑中国制造“国际标准”。

汉字码包括字母组合和数字组合,对应字母键盘和数字键盘,代表设备计算机和手机。对计算机字母键盘,没有规定汉字的哪些构件和笔画对应哪个字母键位,完全是汉字编码的行为,因此在这一领域没有争议;但对手机数字键盘就不同了,如果手机保持原始状态,没有对字母和汉字构件、笔画进行设定,完全由汉字编码来决定,那也不会有争议,但是,一旦对数字键盘进行字母和汉字构件、笔画的设定,就具有排它性,如果这种设定方法不科学或不具代表性,就会保护落后或限制其它方法发展。

从目前数字键盘的各种输入方法看,种类比较多,方法也各异,规范的制定既要体现出科学性、先进性、还要兼顾不同类型,目前看来还是制定几个不同标准为宜,以满足不同企业和不同人群的需求,在市场竞争中逐渐淘汰。另外,因涉及知识产权问题,委托企业制定国家标准会具有局限性,也难以保证先进性,应该在国家有关部门主持下,在全国范围内进行征集,无论是企业还是个人都可以参与,经过专家团评审,媒体公布,最后经国家审批。

规范制定主要是考虑大结构,对细节不宜纠缠,这属企业行为,因此,对数字键盘字母键位设定规范征集后的评测,这里提出如下分三个层次评测方法供参考:

1、输入26个英文字母

这是第一个层次,是硬指标,是把中国标准推向世界的重要保证,首先应该确保。优秀的数字键盘字母键位设定方法,要最大限度保证26个英文字母的简单、快速输入。因为26个英文字母个数大于10个数字键,因此每个字母只按1键且不重复是不可能的,最好的结果是每个字母都按2键,且都不重复,还要记忆方便;其次是不等长码长的字母键位设定方式。

2、输入400多个不标调汉语拼音

这是第二个层次,是为输入汉语拼音制定的标准,这是在满足第一个层次之后的评测指标。最理想的数字键盘字母键位设定方法,是在满足第一个层次条件下,按照数字键上字母直接输入汉语拼音而不重复(指400多个不标调汉语拼音),这难度比较大;退一步即使不能做到理想化,也要考核接近这一理想化目标的程度;再退一步才能考虑联想输入,也就是先输入字,再联想输入词。

3、输入汉字形码

这是第三个层次,是最后要考虑的,目前汉字形码的研制,还处于发展之中,除了笔画输入法之外,其它方法目前还没有哪一种能得到人们的普遍认可,因此对输入汉字形码不宜统得过死。

以上条款是数字键盘字母键位设定评测和规范制定的核心内容,至于其它字符、重字键选率、平均码长等指标,属企业行为,要在市场竞争中优化,不宜在规范中具体化。另外,科学设定数字键盘字母键位,不但要有先进性,还要把环保和能源作为重要指标来考核,要节省空间容量和降低研发成本。

 

  复码数字键盘简介

 

由笔者研发的《汉语拼形系列》输入技术,包括汉语拼音、汉语拼形、数字汉语拼音、数字汉语拼形,英文、数字英文六项内容,这在汉字编码由工具属性向文化属性转型中将起到桥梁的作用,其中汉语拼音和英文是已知的;汉语拼形、数字汉语拼形、数字汉语拼音、数字英文是新开发的;汉语拼音、汉语拼形、英文采用计算机通用字母键盘,数字汉语拼音、数字汉