在中国信息化的道路上,汉字编码及输入法,可能是最具中国特色的事物之一。从1978年支秉彝公布中国大陆第一个小键盘汉字编码方案“见字识码”起,编码方案曾如雨后春笋般涌现,并一度形成“万码奔腾”局面。近三十年间,汉字编码的统一之路依然山重水复。这个问题已经并将继续影响中文信息化进程,应该引起高度重视。
汉字编码至今难以统一,原因是多方面的。我国著名科学家钱学森早在上世纪九十年代中就明确指出,电子计算机即将带来一场伟大的深远的变革,对我国来说,汉字的编码是个必须抓紧解决的问题,是百年大计。时至今日,我们甚至还没有统一的、明确的战略目标,导致众多研究者各自为战,或出于个人偏爱,或囿于一己之见,做出各种以己之长比人之短的方案:有的号称三分钟就可学会,有的要设擂台比试输入速度,还有的宣传可以方便输入“难打字”等等,总之是扬其一点,不及其余。由于没有明确的战略目标,所以我们不知道什么样的输入法是理想的输入法,竟然将判断汉字编码及输入法优劣这样一个理论性、学术性、文化性极强,隐含社会成本极高的复杂课题,简化成一个市场问题,交由市场去裁决。
回顾我国汉字编码及输入法技术发展进程,不少人作出了卓越的贡献。与软件界的贡献相比,语文界少有作为。
汉字编码主要用于汉字的键盘输入,同时也可用于汉字的排序检索以及辅助汉字教学。汉字键盘输入法包括编码和软件两个层次。由于电脑硬件持续、快速的升级换代,在软件层次已经可以为输入法提供比“足够”还要多的支持,只要是符合逻辑的功能要求,软件似乎都能实现。
输入法要有根本性的突破,关键在编码层次。编码层次解决战略问题,软件只提供战术手段,战术是为实现战略目标服务的。汉字编码与汉字的关系最为密切,是直接为汉字服务的,因此,语文界应关注汉字编码及输入法研究。
语文界可以在三个方面有所作为:第一,要基于汉字教学和汉字应用的需要,确立汉字编码及输入法的战略目标和要求;第二,要加强语言文字规范化建设,提高汉字规范化水平;第三,要根据既定战略目标和要求,开展对汉字编码及输入法方案的评价工作。三个方面归结到一点,就是要将汉字编码及输入法纳入到汉字教学和汉字应用的大系统之中统筹考虑,从宏观上引导汉字编码及输入法研究向更高层次发展。
汉字编码及输入法的战略目标要基于汉字教学和汉字应用的需要,而不是基于技术可能性来确定。
先从汉字教学的角度考察:小学生先学汉语拼音辅助识字,需要同步地用拼音输入汉字;接着学习按照规范的笔顺书写汉字,需要用笔画输入汉字;学生开始学习汉字部首,同时随着识字量、词汇量以及拼音、笔画、部首等汉字基础知识水平的逐步提高,对汉字输入速度的要求也相应提高,这时就需要同时用拼音、笔画和部首高效率地输入汉字。这是一个连续的、动态的变化过程:只懂拼音时就用拼音输入汉字,学了拼音又学写字就可同时用拼音和笔画输入汉字,学习部首后又可同时用拼音、笔画和部首输入汉字;认识的字可用拼音、笔画和部首输入,不认识的字可用笔画和部首输入,难以确定部首的字可用拼音和笔画输入。由于拼音、笔画和部首知识水平以及识字量因人而异、因学习阶段而异,需要混合使用各种方式输入汉字。再从汉字应用的角度考察:首先,中国拥有五千年文明史,汉字本身也有三千多年的历史(从甲骨文算起),一脉相承的汉字文化给我们留下了宝贵而丰富的历史遗产,我们需要在信息时代很好地继承这些遗产。因此,汉字编码及输入法需要以全汉字集为处理对象(古文字拟另行处理)。除了电脑输入外,汉字还需要统一的、高效的排序检索方法,用于汉语字典查字以及图书档案馆的图书资料检索等。学生们毕业后将成为各行各业的从业人员,需要凭他们在学校就已熟悉的输入法来满足不同职业对汉字输入的要求,而不必重起炉灶另学一种输入法,也就是说,需要全社会通用的输入法。
综上所述,同时从汉字教学和汉字应用的角度考察,我们似可导出汉字编码及输入法的战略目标:我们需要统一适用于键盘输入和汉字排检的汉字编码;需要建立在汉字基础知识之上、应用拼音、笔画和部首,能够“无级变速”式的汉字输入法;需要以全汉字集为处理对象、通用于全社会的汉字输入法。
显然,要同时满足上述需要,任何单一方式,无论是音码、形码、还是音形结合码等都无能为力。如果将它们科学地组合在一起,例如用音码或音形码输入常用字、用形码输入全部汉字等方式,就有可能满足需要。因此,实现上述战略目标和要求的可能途径是集音码、笔画码、形码和音形结合码等不同方式于一体,无需切换即可混合使用,使它们优势互补,各尽所能。不同方式的组合不是“拉郎配”,每一种形式的编码都应该放在整个编码系统中统筹考虑,利用码元、键元和编码方式的巧妙组合,使各种方式既共存一体,又互不干扰。
为了实现汉字编码及输入法的战略目标,语文界还要加速、加强语言文字规范化建设,提高汉字的标准化、规范化水平。(作者单位:天津水泥工业设计研究院)