语言文字网(YYWZW.COM)>>>专题文集>>>中文世纪行
键盘编码是时代的错误吗?
毕可生
据米阿伦说:现在什么、什么等众多‘学者’
(?)都有一种理论,说是:“键盘编码是时代的错误。”但是,我清楚的记得,2000年,《中华人民共和国通用语言文字法》公布不久。周有光在《中华读书报》上的一期头版中心位置,有一篇答记者问。他高兴地对记者指着说:我用这台脑已经八年(估计是台286),国人都不重视使用电脑(其实我国当时电脑的个人拥有量已超过六千万台,而且大部份是586了)。他还对记者会意地一笑说:“我比他们要快两三倍。”这里的两三倍显然不是指中文的输入。因为,按大家都知道的事实,编码元老五笔字型的及格水平是每分钟80个字。如果说快两、三倍那就是每分钟160到240个字。这对周老先生的实际来说,显然是无法令人相信的。何况周有光使用的准定是拼音码。而拼音码在三大类编码中是最慢的。一是因为它有严重的重码率(汉字同音字很多):其二,周有光曾经杜撰的字音符合打作规律的理论也是错误的。因为任何文字的写作或打作最后都必须落在字形上。如:中文必须想到这个字是如何写的,也就是它的字形如何;而拼音文字也必须去思考它的字母拼写如何。任何文种的字音是直接上不了键盘或纸面的。其理甚明。所以这里指的显然是拼音文字。欧洲拼音文字一般词的动态码长是五点五或六键(不信,可以任一段文字做试验)。而英文科枝词汇的平均静态码长,更长达十一个字母。但五笔输入法的词的平均码长却只有三键。所以,即使不论打作的熟练程度,中文的电脑输入也比任何拼音文字的电脑输入快一倍是无问题的。如有人不信不妨以马克思的著作为例,计算一下,同一段落的中、英、法、俄四种文本所需的击键数,便是了然的铁证!
不错在答记者问时,周有光还说了:“人家日本早就不用编码了。”这句话对日本的钦羡之情溢于言表。而米阿伦更是跟随着这样说的。但这与事实相去远甚。如果不是道听途说,那就只能说是崇洋媚外,用‘日本’吓唬中国人!事实上日文是世界上最不便于用任何键盘输入的一种文字。日文既有五十一个平假名(即字母)还有相应数量的片假名。如果上了键盘那就几乎占满了字盘。这两种假名还要加上切换键才能互换。但是它和欧洲文字的大小写又不同。它的大量外来语又全是必需用片假名书写,而且这种外来语不仅用的假名多,而且中间还插着拗音和促音,光用一下SHIFT键是不行的。必需用功能键加以切换。此外,它还有在假名上加两点的二十个浊音和假名上加小圈的五个半浊音。也还是‘另外’,它还有拗音和促音。这些假名都摆上键盘是不行的。必需加以切换。而且切换时必需给以指令否则它们是不能像米阿伦说的“自动就切换了”。不仅是这样。此外,日本还有文部省规定的1945个汉字,这些汉字一般有两种读法。一曰音读(是学的中文读法)重码就多一些;一曰训读(是日本原来这个字义的读法)重码就几乎没有。但这个字是用哪种读法,也得从习惯。而且日本的汉字也得有字符集(字库),尤其不能像
米阿伦胡说的那样“自动就转换了”。不过,好的是日文单个汉字多使用拼音码就行了(不过也还是绝不可能‘自动就转换了’)。而且,还要有一个‘此外’,那就是日文还有六万多汉字双字词和多字词。这些词多半还有注假名,也就是要在两个汉字旁加注有小字的假名。注假名是用音读还是训读就不一定了。如:日本已经编出来的用于考古和古汉字研究的九万汉字的大字符集《文字镜》那个‘镜’字就必需加上注假名かがみ而不能读成源自于中文的音读きょぅ。所以,这样的字库的输出法连拼音码也不好用,只能用字形码了。到了上个世纪九十年代日本人实在觉得满键盘都是假名,而且又得用各种功能键切换来切换去是太繁。于是把日本的假名也换成了罗马字母作代码。(当然打出来字还是日文假名或汉字)这样键盘虽是清楚了,但是切换的次数增加了,而速度也就又慢了一半。因为绝大多数假名都得用两个罗马字母编码。由此可见,说“人家日本早就不用编码了,”或“可以自动切换。”就完全是无知或欺人之谈了。
为了说明“键盘编码是时代的错误”。米阿伦还装出好像是忧国忧民的样子,气哼哼地说:“中国花了30年的时间,投入的资金和人力难以胜计,尽管一再出现“万码(马)奔腾”的局面,然而汉字字库连汉字总量一半还没有完成。……。”这里我首先要正告米阿伦,不许你诬陷汉字。你说的汉字字库连一半还没有完成,只是你的孤陋寡闻。上个世纪九十年代中期我国《四库全书》的文本版光盘出版时,已完成了五万多字汉字字库。之所以一般只用GB字库。是因为这些字库已经足够使用了。我上文说过汉字字库的区位数是36的四次方。也就是一百六十多万个区位。是你夸大了的汉字总量的二十五倍。五笔字型的四码汉字输入的总容量是25的四次方。是你夸大了的汉字总容量的七倍半。二笔字形的声形码如果增加到四键出字,也是你所谓的汉字总量的十倍(即23X30的立方)。就是拼形码和钱码也都有汉字总量的数倍以上的容量。此外,我国的考古研究部门、古文字研究部门以及历史研究部门也都在合力编制一个包括楷书、草书、隶书、小篆、大篆(籀文)金石文以至甲骨文的大字库。既然日本人能编出一个九万字的这样的《文字镜》大字库,那未我们会编得比他们更完备。
至于说到万码奔腾,这也是过份夸大的说法,对于不坏好意的人,这就是别有用心!因为经过竞争能在市场上获得份额的汉字输入法,正如周青等人大代表推荐二笔输入法的提案里所说“在市场上流行的也有十几种”而已。
说因而浪费了国家多少资财,就更是扯淡之论。当初正是有些人兴高采烈地说:“电脑是汉字的掘墓人”的时候,八十年代初王永民先生的五笔字型输入法一举打破了汉字进不了电脑的谰言。使用的结果证明汉字不仅能进入电脑,而且比世界上任何拼音文字更先进更快捷。但必需指出的是王永民先生研制五笔字型时,并没有花国家一分钱!以后又有人提出了汉字电脑输入的瓶颈问题,而二笔输入法和拼形码,以及诸多五笔的改进输入法都注重了码元(字形字母)的数字化程度。彻底打破了刁难汉字输入法“好学的不好用,好用的不好学”的神话。使汉字成为当今世界上唯一可利用电脑进行快捷非全息输入的文字。
剥开了米阿伦这些枉加给汉字和二笔输入法以及对CESI认证的诽谤不实之词之后,终于显露出米阿伦骨子里的东西是什么了。这就是他说的:“中文信息技术的发展的关键所在,……文字方式改革是历史的需要。”什么叫“文字方式”的改革?听起来似是而非。其实说穿了不过是“老调新弹”改头换面的拉丁拼音化而已。只是这个旧名字声誉不怎么太好,所以,改叫“文字方式改革”,其实酒还是一样的。说起汉字的文字改革这是整整闹了一百多年的一场大戏。远在一百多年前的十九世纪末,福建那个洋奴小买办卢赣章就打着“爱国”的旗号攻击汉字,说英文只须学会二十六个字母,拼法学会就会了英文。所以中文也要改拼音才对。这在当时像外文奇才辜鸿铬那样的人还是凤毛麟角的时代,国人自然是不知就理的。但现在再卖这样的狗皮膏药和谎言定会遭人嗤之以鼻。不过无论是当时还是现在说他是爱国,我们是不会上当的。因为他一生的大作《一目了然初阶》完全是用瞿理氏拼音编写的闽南话。(现在倒是很适合台独分子的口味)这种文字一旦推广,中国岂不是要四分五裂,还有什么中华文化可言?!所以,他不过是自己在中文英文都混不出个人样来的时候,借此出点小名罢了。到了二三十年代,特别是五四以后,许多有识之士,眼看外文从打字到印刷都比中国先进得多。外文的机械打字机已经发明了快一百多年。而到了五十年代中国才有了笨重的打字机。这种机子笨重不说,它的常用字盘只有2450个汉字,备用字也只有1716个。每分钟最快也只能打四十个字。而印刷术,仍然用的是手工捡字。一本书的出版周期有时竟会慢到一年。面对这种落后的情况,要求改革汉字是可以理解的。不过,到了改革开放以后,党中央和我国政府还是考虑到文字的传承一贯和她是民族文化的根基,取消了文字改革委员会而代之以文字工作委员会。在这一机构中也取消了继续进行文字改革的任务。进入八十年代,王选院士汉字激光照排印刷术的发明,使我国的印刷技艺发生了翻天覆地的变化。与此同时,以王永民的五笔字型为首的各种输入法完全打破汉字无法进入电脑的预言,一举获得了惊人的成就。证明汉字是世界上最能适应电脑枝术的文字。这种情况与工业化时代的情况正好相反。进入信息时代(或称后工业化时代)世界上除汉字以外的一切拼音文字,仍然在电脑上使用着近两百年前的机械打字方法,使用着文字的全息输入而裹足不前。拼音文字在工业时代的绝对优势,在信息时代一下子完全让位于世界上唯一拼形表意的汉字了!
在这种新形势下,我国人大常委会才通过了《中华人民共和国通用语言文字法》并于2000年元月一日正式施行。这是建国以来,文化、教育及信息交流上的一件空前的大事。《语文法》是国家的大法。在这一法律中明确规定规范汉字为我国的通用文字。这
|