有关汉字键盘输入的国家标准与规范 华绍和 蒋顺炳 陈一凡(汉字编码专业委员会)
【摘 要】本文列出了汉字键盘输入系统设计者应遵循的五个国家标准和三个语委规范,并指出了这些标准和规范内容要点。【关键词】国家标准,语委规范,性能指标,键选率 一、国家标准和规范具有一票否决权 为适应中文信息处理量的迅猛增长、计算机应用的普及化和参加 WTO后与国际接轨,人大常委会、信息产业部、国家技术监督局、国家语委从上世纪九十年代中期开始加快了语言文字和中文信息处理领域的立法和国家标准、规范的制定。世纪之初,国家颁布了《语言文字法》。九十年代后公布的与汉字键盘输入系统有关的国家标准有:GB13000.1 《信息技术多八位编码字符(UCS)》GB18030 《信息技术 信息交换用汉字编码字符集 基本集的扩充》GB18031 《信息技术 数字键盘汉字输入通用要求》GB15834 《标点符号用法》即将公布的有 GBXXXXX《信息技术 通用键盘汉字输入通用要求》,语委颁布的规范有: GF3001 《信息处理 GB13000.1字符汉字部件规范》,GF3002 《GB13000.1字符集汉字笔顺规范》GF3003 《信息处理用汉语拼音方案表示规范通用键盘》。据悉,上述标准与规范将纳入国家技术法规而强制执行。作为产品出售的汉字键盘输入系统,无论是编码层次还是软件层次,均应遵循标准和规范,否则不能通过产品认证。 二、与汉字编码有关的标准与规范 1 .编码字符集GB2312 6763 字GB13000.1 20902 字GB18030 27533 字GB/T 18031 对数字键盘编码的要求是:“应包括GB2312或GB13000.1或GB18030中定义的全部汉字字符。”GBXXXXX 对通用键盘编码的要求是:“应包括GB18030中定义的全部汉字符号和现代汉语标点符号”。2 .键位设置GB/T 18031 规定“输入汉字的编码元素,设定在0~9的数字键范围内。”并对五种基本笔画和汉语拼音符号的键位作了规定。多笔画部件及笔画组合可以自由设定。GBXXXXX 规定“‘A’~‘Z’26个字母键输入汉字和词语的特征编码信息”。“‘0’~‘9’10个数字键,除用来输入阿拉伯数字外,还可用来输入汉字和词语的特征编码信息的辅助信息,包括汉语声调、重码字选择等。” 这就明确规定了在通用键盘上只能用26个字母键进行编码。3 .标点符号GB/T 15834 定义了23个标点符号,国家标准《通用键盘汉字输入通用要求》对这23个标点符号的键位进行了规定。4 .部件规范GF 3001 对GB 13000.1的20902个汉字进行逐个拆分、归纳与统计后给出了560个基础部件。形码设计者应重点关注《规范》要求的以下几点:⑴基础部件也称末级部件,是最小的不可拆分的部件。 ⑵基础部件可以组合成成字部件使用,但不得组合成非字部件。 ⑶汉字拆分为部件时,应遵循“相离、相接可拆;交重不拆(可拆成笔画)”的原则。 1998 年5月1日 GF 3001正式实施后,一批原本素质较好的编码迅即修正了拆分规则,成为既完全符合规范要求又不失本身特点的优秀编码,如表音码(沈码)、表形码、自然码、郑码和认知码等。部件称谓规范正在制定之中。 5 .笔顺规范GF 3002 明确了汉字的基本笔形是五种“其排列顺序一(横)、丨(竖)、丿(撇)、丶(点)、乛(折),分别用符号1、2、3、4、5表示。GF 3002 还给出了GB 13000.1的20902字的规范笔顺。 三、汉字键盘输入系统的性能指标 国家标准将编码层次和软件层次视为统一的键盘输入系统进行性能考核。 GB18031和《通用键盘汉字输入通用要求》提到的系统性能指标有三个:易学性,汉字输入平均码长和重码字词键选率。国家标准给出的指标是当前应达到的最低要求。1 .易学性“学会使用汉字编码输入系统的时间应尽量短,并应符合使用汉语作为母语的使用者的思维习惯”。 GB 18031对数字编码更进一步提出要求:“做到上手能用”。2 .汉字输入平均码长定义:在输入给定的测试样本时,测得的输入每个汉字的平均击键次数。 计算公式:平均码长 = 输入样本的击键次数/测试样本总字数(键/字)《通用键盘汉字输入通用要求》给出的指标 编码类型 | 平均码长(键 /字) | 汉语拼音,笔画为主的简易编码 形码(部件码)、音形码(形音码)、双拼 | < 3.2< 2.2 |
GB 18031 (数字键盘)给出的指标 输入方式 | 平均码长(键 /字) | 逐字字段输入 字、词混合输入 | < 6< 4 |
3 .重码字词键选率我们应该特别注意直接面对汉字键盘输入的两个国家标准均用“键选率”来考核输入系统的速度素质和易用程度,而舍弃了沿用多年的“重码率”。 定义:在输入给定测试样本过程中,通过重码选择键确认的汉字字数与测试样本总字数的百分比。 计算公式:重码字词键选率 =(重码选择键确认的字数/测试样本总字数)×100% 《通用键盘汉字输入通用要求》给出的指标 编码类型 | 重码字、词键选率( %) | 汉语拼音,笔画为主的简易编码 形码(部件码)、音形码(形音码)、双拼 | < 6< 1.5 |
GB 18031 (数字键盘)给出的指标 输入方式 | 平均码长(键 /字) | 逐字字段笔画、部件码输入字、词混合笔画、部件码输入逐字字段拼音输入(10键位)逐字字段拼音输入(8键位)字词混合拼音输入(10键位)字词混合拼音输入(8键位) | < 8< 10< 13< 14< 12< 14 |
四、汉字键盘输入系统的考核 作为面向市场的汉字键盘输入系统,应该通过标准符合性测试、产品论证和专家技术鉴定。下列单位是政府授权或具有行业权威的测试、论证和鉴定部门。 1 .标准、规范、性能指标测试 中文信息处理产品标准符合性检测中心2 .产品论证 中文信息技术产品认证中心3 .专家技术鉴定 中国中文信息学会汉字编码委员会第 1项测试输入系统是否符合国家已颁布的规范、标准和性能指标,给出《测试报告》。第 2项从产品的角度论证输入系统是否具备商品软件生产的条件,如能通过,给出《论证合格证书》。第 3项由本领域专家从技术的角度评审输入软件特色、优缺点和水平。技术鉴定给出《鉴定意见》。在上述三种考核中,第一项测试具有一票否决权。 参考文献:
[1] 国家标准5个(见本文第一段)[2] 国家语委规范3个(见本文第一段)[3] 汉字部件规范研制组,关于制定《汉字部件规范》的若干问题,计算机世界,1998.4.27技术专题版[4] 王宁,陈一凡,谈从理与从形拆分原则,计算机世界,1998.4.27技术专题版[5] 邢红兵,崔永华,张普,对部件称说的建议,计算机世界,1998.4.27技术专题版[6] 沈克成,汉字在规范面前不能有容错,计算机世界,1998.4.27技术专题版[7] 何克康,《汉字部件规范》使认知码具有更好的规范性,计算机世界,1998.4.27技术专题版[8] 柴鸿斌,陈维兴,宋利强,规范、易学、智能是汉字键盘输入技术的发展潮流,计算机世界,1998.4.27技术专题版[9] 郑珑,规范化是中文信息处理的必经之路,计算机世界,1998.4.27技术专题版[10] 周志农,规范化使自然码更加自然,计算机世界,1998.4.27技术专题版 |