电脑、汉字、文化 ——汉字输入法的理论初探
王尧世 【摘 要】一国之文化,是国民生活经验和智慧之累积,其载体主要为文字,所以文化和文字,两者相互依存,谁也少不了谁。 中国的汉字,承载着中国的文化,更蕴含着中华民族的智慧。象形和形声,是其中的特色和精华。没有象形和形声的特色,汉字的优点便荡然无存,中国的文化将随之动摇。 电脑的出现,为信息传播技术开创了崭新的模式,创造了空前的效率。而信息的载体,仍必须以文字为主。所以文字处理技术〔即汉字输入〕是信息处理技术的重要组成部份〔基础〕。 汉字输入方法,牵涉到方方面面。例如:汉字的特性、使用的工具、应用的范围和使用者的学习能力等等。本文试图从這四个角度,对现况进行观察分析,并提出解决问题的明确主张。 1.汉字输入与中国文化 中文汉字是成熟优美的文字。中国在历史上的点点滴滴,都用它来记载;我们在生活中的方方面面,都用它来描写。没有汉字,便没有中国文化。 中国文化的发展,受汉字的影响很大。而汉字的发展,又直接受着书写和印刷工具的影响。所以一个时代的文字书写和传播工具的改变,深刻的影响着〔实际上就是推动〕那一个时代文化的发展。 从二十世纪末叶开始,中国和世界一起进入电脑信息科技时代,人类文化的发展又走到了一个新的转捩点。我们手中的笔,将逐渐走入历史,按键将成为输入文字的主要方法。电脑将成为新的文房四宝。汉字输入电脑,是中国文化和西方科技接轨的基础,电脑中的汉字输入方法,对未来中国新文化的发展,必然会产生决定性的影响! 2.汉字输入问题的分析 随着电脑的普及,使用电脑的人口,年龄层不断扩大。对于各种不同年龄层次的使用者,在汉字输入上各有不同的问题。 2.1. 对于中老年人: 问题之一:用字形,要背要记的太多、想记记不住。 问题之二:用拼音,年轻时没有学过,或已经忘记。 在字形与拼音两头都够不着的情形之下,许多中老年人,虽然满心想学、想用电脑,也只好望着电脑兴叹。大量有丰富知识和经验的社会精英,被排拒在电脑门外。 2.2. 对于青少年人: 问题之一:用字形,要背要记的太多、想想也害怕。 问题之二:用拼音,看似没有问题,实际问题多多。 青少年人虽然拼音能力强,但有汉字特性和自身条件的限制。 ①在汉字特性方面:汉字天生的“字多音少”,同音字或词都十分严重。无论使用那一种智能拼音,在理论与实际上都难以克服选字的麻烦。 ②在自身条件方面:青少年人虽然拼音熟练,但认识的字数有限。电脑中不会读的字太多,用拼音根本无法输入,用字范围只能在自己认识的圈子里打转。一旦遇到自己不会读的字,谁也不敢说汉字输入“没有问题”。 3. 汉字输入理论的初探 目前,国内外的汉字输入方法虽然已经很多,但都还非常稚嫩。大多数的方法只提出一些一时权宜的措施。没有理论基础,没有宏观构想,甚至连汉字的基本特性也弃置一旁。这些方法的共同之处是:它只能告诉使用者怎样做(How?),却无法告诉他们为什么(Why?)。 本书试图从“人性本能、社会需要、汉字特性、键盘环境、”等四个角度,架构起一套汉字输入的理论。用客观的理论告诉我们:①社会需要什么样的汉字输入法?②汉字的特性是什么?,③影响汉字输入法的客观条件为何?以及④怎样才是合情合理、合乎时代和大众需要的汉字输入法? 3.1. 汉字输入应该解决的问题 汉字的优点很多,但它也有两个不易解决的问题: 第一、汉字检索不便。第二、输入电脑不便。 今日的汉字,好比有聪明的头脑,但缺乏两条健全的腿,行走非常不便。多年以来,汉字为人所诟病者在此。所以,任何优秀的汉字输入法,必须同时能解决这两个难题,使汉字既有聪明的头脑,也有两条健全的腿,才是汉字问题的根本解决。 3.2. 我们需要什么样的输入法 以上的分析,我们认识了影响汉字输入的几个关键。从人心要求角度来看,一种成熟的汉字输入方法应该避免下面几个陷阱: 第一、必须以字形代替拼音,符合汉字特性,避免拼音障碍。 第二、必须以视觉代替笔顺,符合看形按键,适应新的要求。 第三、必须以客观代替主观,符合键盘特性,真正一看就懂。 第四、必须以逻辑代替口诀,打汉字讲道理,避免死背强记。 第五、必须以广用代替单用,满足检输合一,解决根本问题。 第六、必须以效率取信大众,比较实际效果,避免权威压人。 3.3. 汉字特性给予我们的启示 中文汉字,论及造字原理,虽有六书之说,但如今我们所使用的汉字,75%以上都是以“象形字”为基础的“形声字”。所以“象形”与“形声”是汉字的最主要特色。 一般形声字,包含“义”与“声”两个部分,其中“义部”代表字义,“声部”表示读音。“义部”与“声部”,都以“形”为特征表示出来。例如: 在“湾、湖”两个字中,氵为义部,表示与水有关;“弯、胡”分别表示读音。 在“芬、芳”两个字中,为义部,表示与草有关;“分、方”分别表示读音。 在“忠、恕”两个字中,心为义部,表示与心有关;“中、如”分别表示读音。 用这种方法造字,有二个显著优点:第一、能“望文生义”,符合人性。第二、能“以少驭多”,所以非常科学。好的汉字输入方法,必须符合汉字“以形表意”的特性,使用者才能轻松驾驭汉字,发挥出汉字的优点。 3.4. 汉字造字法的优点和缺点 “象形”和“形声”字的特色在“形”和“声”,它的优点是更贴近人性〔更适合用眼睛看──能够望文生义〕,但亦有缺点。 放眼当今世界,所通行的文字,可以分为两大类: ①象形文字──可以汉字为代表。②拼音文字──可以英文为代表。 拼音文字的特点在使用字母。使用字母有二个显著的优点: ①有了字母,就有了统一的排序,所以检索方便。 ②因为字母个数有限,容易用机械〔包括打字机和电脑〕处理。 以上二个优点,亦正是汉字严重的缺点。 这二个缺点成为许多人诟病汉字的焦点,甚至动摇了中文汉字数千年的根基。有人主张废除汉字,就是忘了汉字的优点而只看到它的缺点。汉字输入方法的纷歧,根本原因亦在这里。 3.5. 取长补短在建立合理字码 我们的汉字,由基本笔划和部首组成,表面上没有标准的字母,亦没有统一的排序,因此缺少了字母文字的优点。 从汉朝的许慎作《说文解字》以来,人们的注意力只在笔划和部首之间打转,直到二千多年以后的今天,问题没有太大改善。 但自从汉字产生了“码”的观念之后,汉字排序和机械化处理问题的解决,显露了端倪。通过码的使用,汉字可以有了排序。通过码的使用,汉字也可以机械化处理。接下来的问题是:“码”好不好用?合不合理? 所以,如今的问题是:怎样为汉字建立一套好用、合理的字码,使它既保有汉字原有的特色和优点,又具有字母的功能。也就是创造一套使汉字既贴近人性,保留特色,又便于检索和机械化处理的字码。 3.6. 中西结合是码的大势所趋 怎样才是汉字合理的字码?这要从码的内涵和使用者的角度去考量。 第一、码的内涵有二层:①既要保留汉字特色、②码的形式必须通用。 ①从汉字特色来看,还是不能忘记“象形”与“形声”。 ②从码的形式考虑,不能不使用英文字母和符号,因为它是当今全世界最通行的文字符号,也是电脑键盘上唯一的文字符号。 从以上二个前题,我们把问题缩小了范围:“如何用英文字母和符号,依汉字的特色输入汉字?” 这个问题牵涉到一中一西二个方面。 第二、使用者的角度是:将一中一西二个对象,加上人的因素,三者结合,只有二种方式: ①中文(字元)─→通过人(背诵记忆转换) ─→英文(字码) ②中文(字元)─→通过人(逻辑推理转换) ─→英文(字码) 第①种方式就是一般的字形类输入法,其中的“背诵记忆”缺少客观标准,不讲求逻辑,只讲求记忆,其缺点之分析,已见本文以上各节。 去了芜,存下菁。第②种方式是我们可以找到“合理”字码希望之所在,它就是研究汉字输入理论的焦点。 3.7. 以中英象形替代死背强记 此处,推理的起点是汉字,它的特色在字元的形状。推理的终点是个别的英文字母和符号,它的特色亦在形状。把这二者结合起来,最直接的方式是用眼睛看,而以像与不像为客观标准。 这样,就为我们带来了合理的答案,那就是:“中→象→英”。 “中→象→英”的含义是:“将中文字元的形状,通过人的眼睛和象形思维,转化为相似的英文字母和符号,就成为中文字元的“码”。这个过程,将主观意识降至最低,客观成分提至最高,人脑工作的路径最短,是汉字码的最高境界〔“中→象→英”在这里是一个概念,具体的方法见本文第4段〕。 中西以象形结合,配合简单的形声取码规则,作为汉字的字码,解决了汉字悬了二千多年的难题,使汉字既保有了传统的优点。又很方便的检索和机械化处理。 3.8. 以形声双轨排除单轨障碍 汉字输入法从开始到现在,已发展成字形类与拼音类两大派别,其间壁垒分明,互不相让。实际上,字形与拼音皆各有所偏,形声兼用,则能避其短而扬其长,而且用途广,使用更方便。 ①在避短上──简化字形为首尾两码,简化拼音为首音一码,再将两者结合为一字最多三码,简化了拆字规则,使学习更加容易,而且按键少,输入更快。 ②在扬长上──经常写一些东西的人,有时会遇到一些知其音而忘了形的字,也会遇到一些知其形而不会读的字。这时,如果你惯用字形输入法,遇到第一种状况,打不出字。如果你用拼音,遇到第二种状况,也打不出字。这是字形或拼音单一方法的严重的缺失。而既用形又用声的双轨码,正可以弥补这项缺失。 ③解决查字困难──目前,每一本中文字典,都必须同时有部首与拼音两种索引,不但浪费了巨大的篇幅,而且使用不便。试看任何一本英文字典,根本不用索引,查起来却快又方便。两者差别在那里?差别在汉字的排序。按照拼音编排,乱了部首,而且不知读音的字无法查;按照部首编排,又乱了拼音。而且查一个字需要数二次笔划,很不方便。如将汉字的形首、形尾,转变成形状相似的英文基码,按英文字母顺序排列。检索时不用数笔划,也不需要索引表,检索汉字,比查英文字典更快;即使不会首音,只要使用形首、形尾,也能很快查到。 4. E码汉字输入法简单说明 根据第三段所架构的理论,设计〔首尾音〕与〔中象英〕的E码。简单说明如下: 4-1. 〔首尾音〕取元规则 一般中文汉字,只取形首、形尾、首音三个部份;无形尾的,只取形首、首音两个部份。其中形首在字的上方、左边、左上角、或外部。形尾在字的下方、右边、右下角、或内部下方。不会汉语拼音者只用形首、形尾即可。 例如: 〔首〕的形首为〔丷〕,形尾为〔目〕,首音为〔S〕。 〔音〕的形首为〔丶〕,形尾为〔日〕,首音为〔Y〕──以上为上下型汉字 〔创〕的形首为〔人〕,形尾为〔〕,首音为〔C〕。 〔汇〕的形首为〔氵〕,形尾为〔匸〕,首音为〔H〕──以上为左右型汉字 〔原〕的形首为〔厂〕,形尾为〔小〕,首音为〔Y〕。 〔因〕的形首为〔囗〕,形尾为〔大〕,首音为〔Y〕──以上为包含型汉字 〔人〕的形首为〔人〕,无形尾,首音为〔R〕。 〔口〕的形首为〔口〕,无形尾,首音为〔K〕。──以上为独体型汉字。 4-2. 〔中象英〕编码原理 将汉字的〔形首〕和〔形尾〕,转换为形状相似的英文字母或符号,再加上〔首音〕,就是E码。照此按键,就能输入汉字。 所有中文汉字,都是由〔点、横、撇捺、直〕四种基本笔型组成,再由这四种基本笔型,产生31组〔14对+3〕基本字元,每一组基本字元有相同的特征,用一个形状相似的英文字母或符号代表此特征,这便是中象英的基码。 说明: ①以上31组包括了所有出现在汉字首尾的字元,少数表中找不到的字元,以相似者替代。在电脑上,可用万能键[﹨]替代,输入无障碍。 ②以上31组字元的中英象形代码〔如底下行所示〕有90%以上与英文字母或符号形状相似,只有最后3个〔带*号者〕稍有差异。请注意! 附表1:中英象形基码表 点 类 | 撇 类 | 竖 类 | 撇捺类 | 羊火头 | 纵横类 | 封口类 | 3/4封口 | 单点型 | 多点型 | 单撇型 | 多撇型 | 直竖型 | 直钩型 | 撇捺型 | 斜交型 | 羊字头 | 火字头 | 十字型 | 卄字型 | 口中空空 | 口中有物 | 上开口 | 下开口 | 丶亠讠礻衤 | 冫丬氵水 | 丿亻 | ⺈夕彳彡爫 | 丨卜忄心 | 刂丁扌 | 八人大夫 | 乂又攵女 | 丷羊 | 小火灬 | 十丰巾中 | 艹卄业川卅 | 口 | 日目四田母 | 凵山臼 | 冂门月 | · | ; | ∕ | 〃 | I | J | A | X | V | W | T | H | O | Q | U | M |
3/4封口 | 1/2封口 | 阝尸类 | 竹木类 | 扭折类 | 王贝类 | 其 他 类 | | 右开口 | 左开口 | 右下开口 | 往下向右 | 耳朵型 | 尸户型 | 竹片型 | 木字型 | 向右扭折 | 向左扭折 | 王工型 | 几贝型 | 单横型 | 宝盖雨鸟 | 土士型 | 万能键 | 匸 | 勹弓 | 厂广疒斤 | 乚七弋廴辶 | 卩乃耳 | 尸户 | 片爿 | 木未末耒丫 | 厶幺纟巛 | 了 子犭 | 工王正互亚 | 儿几九尢贝 | *一 | *冖宀鸟 | *土士 | 查 询 用 | C | D | F | L | B | P | K | Y | S | Z | E | R | , | G | N | ﹨ | | | | | | | | | | | | | | | | | |
附表2:中象英的E码部分字例 以下各字例中,第一码为形首基码、第二码为形尾基码,三码版加首音。 文=形首(丶)+形尾(乂)=基码(.)+基码(X) 、三码版+首音(w) 言=形首(丶)+形尾(口)=基码(.)+基码(O) 、三码版+首音(y) 刘=形首(丶)+形尾(刂)=基码(.)+基码(J) 、三码版+首音(l) 河=形首(氵)+形尾(丁)=基码(;)+基码(J) 、三码版+首音(h) 汉=形首(氵)+形尾(又)=基码(;)+基码(X) 、三码版+首音(h) 汇=形首(氵)+形尾(匸)=基码(;)+基码(C) 、三码版+首音(h) 化=形首(亻)+形尾(乚)=基码(/)+基码(L) 、三码版+首音(h) 信=形首(亻)+形尾(口)=基码(/)+基码(O) 、三码版+首音(x) 行=形首(彳)+形尾(亅)=基码(〃)+基码(J) 、三码版+首音(x) 很=形首(彳)+形尾( )=基码(〃)+基码(K) 、三码版+首音(h) 美=形首(丷)+形尾(大)=基码(V)+基码(A) 、三码版+首音(m) 善=形首(丷)+形尾(口)=基码(V)+基码(O) 、三码版+首音(s) 荷=形首(卄)+形尾(丁)=基码(H)+基码(J) 、三码版+首音(h) 花=形首(卄)+形尾(乚)=基码(H)+基码(L) 、三码版+首音(h) 限=形首()+形尾()=基码(B)+基码(K) 、三码版+首音(x) 陆=形首()+形尾(山)=基码(B)+基码(U) 、三码版+首音(l) 邓=形首(又)+形尾()=基码(X)+基码(B) 、三码版+首音(d) 部=形首(丶)+形尾()=基码(.)+基码(B) 、三码版+首音(b) 合=形首(人)+形尾(口)=基码(A)+基码(O) 、三码版+首音(h) 俞=形首(人)+形尾(刂)=基码(A)+基码(J) 、三码版+首音(y) 展=形首(尸)+形尾()=基码(P)+基码(K) 、三码版+首音(z) 尾=形首(尸)+形尾(乚)=基码(P)+基码(L) 、三码版+首音(w) 请仔细观察以上字例,读者不难发现:各字的第一码,形状很像形首的字元;各字的第二码,形状很形尾的字元。使用形首形尾的中象英基码,输入中文汉字,中西合璧,唯妙唯肖,易认易记,“直觉”而“高雅”。 |