阅读文章

民间汉字书同文研究的主要课题及成果

六、汉字书同文与计算机汉字信息处理

[日期:2007-08-15] 来源:《民间汉字书同文研究十周年纪念文集》  作者: [字体: ]

  在当今信息时代,研究汉字书同文问题,必然要涉及到汉字和计算机汉字信息处理技术的结合问题。

  历次“汉字书同文学术研讨会”和各辑《汉字书同文研究》论文集都有这方面的论文。除了前面专门介绍过的有关“非对称简繁字”的论著外,这方面的论著还有藺蓀、鄭文亮的《论计算机科技对“书同文”的作用》[1] ;沈克成的《21世纪的电脑汉字应分级建库》和陈明然的《连体部件小议》[2]];沈克成的《汉字简繁转换新探》和陈明然的《汉字定量之我见》[3];潘德孚的《论“书同文”和“输同码”》[4];另有陈明然在第七次研讨会上宣读的《论信息时代的汉文字改革》,以及陈培基、王堯世、胡敬禹、杨志浩、戚桐欣、李公宜、董正高等关于输入法的文章等等。

  (一)蔺荪和郑文亮的《论计算机科技对“书同文”的作用》

  香港城市大学藺蓀先生和香港术语学会鄭文亮先生在《论计算机科技对“书同文”的作用》一文中,提出了“汉字机内码”、“汉字输入码”和“计算机辅助汉字学习”三个问题。

  藺、鄭二位指出:“在计算机的应用上,也有多种汉字内码的情况出现”。他们呼吁:“应该考虑如何在计算机上为每个汉字订定独一无二的编码”,即统一内码。

  在“输同文”(即“输同码”)问题上,藺、鄭二位寄希望于计算语言学的进步,他们盼望“将来的世界应该用自然语音输入、键盘连词拼音输入和手写输入”,“要把输入的单位从个别汉字改为词语”。

  关于计算机辅助汉字学习,藺、鄭二位提出了有关供香港学生学习简化字或内地赴港学生学习繁体字等计算机软件的设计思路。他们指出:在相关软件的设计中,要“考虑学生的知识文化背景和香港的特殊语境”;要提供“多元的学习路径、多媒体表现形式”;让学生在“游戏中学习”。

  藺、鄭二位还在文中提出了在当今信息时代汉语汉字研究方面的两个重要问题。

  在文章的《引言》部分,他们指出:“人们达到这个目的(即‘书同文’——编者注)的手法应该是科学的,因势利导的而且还要尽量利用现代科技所带来的巨大的符号处理能力以及资料储存能力”,希望能有“跨学科的专家学者可以共同为‘书同文’这个理想努力。”

  在文章的第二部分《计算机上的书同文》一节中,他们指出:至今为止,有关汉字信息处理标准的制订工作,“主要是信息科技方面和汉字应用方面的人士参与,并却缺少了文字学专家的参与”。文章强调:“计算机‘书同文’的工作尽管繁难艰巨,而且时间上非常紧迫,但是由于代表性并不算太理想,可能影响最后成果的认受性以及合理性,我们希望在处理这一类的问题时,能够尽可能广泛咨询,不要只照顾时间上的紧迫性和方便行事而忽略了最终的认受性。”这些意见,无疑是值得有关部门认真考虑的。

  (二)沈克成的相关文章

  沈克成先生在《21世纪的电脑汉字应分级建库》中呼吁“应该在现有大字库基础上,尽快分级建立现代常用字库和古今通用字库两个系列的电脑汉字字库。”提出“古今通用字库即采用《GBK2.0》大字库,在27000字左右。而现代常用字库的收字量应为7000字。”

  关于“如何制订现代常用汉字库”这一问题,沈先生提出了5点建议:一是“对当今使用的汉字的字频必须重新着手统计”;二是“修订国家标准《信息交换用汉字编码字符集·基本集》(GB231280)”;三是“制订新的各类字表,让各个部门统一实施执行”;四是“对50年代颁布施行的《简化字总表》和《异体字整理表》作一次全面的整理和修订”;五是“尽快制作出一个准确率超过99%的简繁字体一键切换的计算机软件”。

  在《汉字简繁转换方法新探》一文中,沈先生就简繁转换的计算机软件设计问题提出了自己的新思路。文章具体讨论了简繁字库的构造和分类以及转换处理的步骤和要点,“希望能通过努力将这种信息交换的准确率提高到99%以上”。沈码新版本即在这方面进行了努力,实现了计算机汉字输入的打简出繁和打繁出简。

  (三)潘德孚的相关文章

  潘德孚在《论“书同文”和“输同码”》一文中论述了统一汉字键盘输入编码的现实意义,提出了自己对统一汉字键盘输入编码这个问题的见解。

  潘先生认为:“两千年前的汉字现代化就是‘书同文’;现在的汉字现代化就是‘输同码’”。他呼吁:“全国有志有识的同行,舍弃门户之见,抛却陈腐的观念和固有思路,以汉字结构客观规律为依归,以汉字现代化奠基为历史重责,建立一个统一的,现代的学术阵营,努力开创‘输同码’的新篇章。”

  (四)陈明然的有关论文

  陈明然在第七次汉字书同文学术研讨会上宣读了长篇论文《论信息时代的汉文字改革》[5]。该文通过考察从甲骨文至楷书的汉字形体演变历史,提出了“汉语言记录工具的变革是汉文字形体演变的直接动因”这一观点,并在深入分析了计算机处理汉字的原理、方法及汉字的结构、特点后,指出“键盘输入方式下汉文字与计算机的矛盾是信息时代汉语言记录符号与记录工具的普遍性的或者说是主要的矛盾。”认为“汉民族的文字在相当长的历史时期内不可能演变为拼音文字”;“简化已不是信息时代汉文字改革的主要方向”;“现行的表意汉文字系统存在着适应计算机这一汉语言记录新工具的良好基础”;“信息时代汉文字改革的任务,不是拉丁化,也不是单纯的继续简化,而是在原表意文字大框架内对当代通行的汉文字进行适度改革使之适应计算机处理的需要。”认为具体需要解决“连体字元”、“变形字元”及“单体字元”的标准化问题。文章还给出了“字元”、“字素”等系列定义。

  与这篇文章一脉相承,《连体部件小议》对于《论信息时代的汉文字改革》中提到的“连体字元”,以“釜、兼、曹、戋”为例进行了深入的专题讨论。文章认为“部件(字元)连体,模糊了部件(字元)之间的界线,不利于计算机汉字处理中对单字部件(字元)的分析,是当前除数字(流水)码和音码外,各种计算机输入编码方案中含该类部件(字元)的单字被不规则地拆分,惨遭肢解的根源所在。”主张对“连体部件(字元)[6]实行‘分体手术’”,“以利计算机的汉字输入编码处理和识字教学。”

  《汉字定量之我见》一文提出了“在汉字定量问题上确定‘现代通用’原则,并正确认识和处理好‘现实和历史’、‘通用和专用’、‘汉字规范和信息处理技术标准’三个关系”的意见。建议“把正在拟订中的规范汉字表定名为《现代通用汉字表》,按使用频度从高到低收7000现代通用汉字”;并“依据新订的《现代通用汉字表》对GB2312-80进行修订,使计算机汉字信息处理的技术标准与汉字规范相一致。”

  (五)书同文研究沙龙成员发明的计算机汉字输入编码方案[7]

  1.沈码;发明人:沈克成(浙江)。

  方案要点;沈码(学名《表音码》)是一种“音托形码”。该方案以《新华字典》为模本,共取184部;用汉字的部首、笔画作为基本构件,把汉字读音、部首读音、笔画读音有规律地组成代码。其最大特点是符合汉字规律。

  除了一般的编码规则,沈码还给出了一级简码(25字);二级简码(由两个键位代码组成)和三级简码(由三个键位代码组成),简码率占80%,再辅以词组输入,沈码的平均击键数为每字2.1键。

  另外,沈码还提供了万能键的检索功能,当用户对某汉字的取码感到困难时,可用“?”键来检索。

  沈码6.0版新添加了以下功能:

  打字练习、在线词库更新、阿拉伯数字转换汉字大写数字、拼音反查,遇不会打的字可用拼音输入查沈码、简体繁体转换、汉英互译;另外可以在线阅读唐诗300首和宋词、趣味短信、查询全国邮政编码和电话区号。

  2.部首号码输入法;发明人:陈培基(福建)。

  方案要点:部首号码输入法是一种数字(流水)码。该输入法用5种基本笔画形成9种笔形。其中横、竖、撇、点、折5种基本笔画分别用1、3、5、7、9五个奇数代表;另外由横、竖、撇、点所构成的复笔,分别用2、4、6、8四个偶数代表;0可以代表所有笔形和大、小写的数目字。

  所有的字按其第一笔形分为9个系列,每个系列再按其第二笔形分为9个段落。

  使用《部首号码输入法》,只须记住1—9数码各自代表的笔形与0的作用,以及取码规则,就能打出所有的通用字和数万条词语,而且经CTC测试都不重码,实践证明小学生和离退休人员都能很快学会。]

  部首码还有一个重要特点,由于笔形筛选得好和用笔形取码的缘故,不仅可以有简体字版本和繁体字版本,也可以有简体字与繁体字兼容的版本。

    由于部首码是以十个数码作为码符,最大码长5位数,特别是能做到所有通用字和数万条词语全无重码。因此,非常适合在手机和信息电话机上使用,

  3.形声快码;发明人:王堯世(台湾)。

  方案要点:形声快码是一种形音码。将汉字的“形首”和“形尾”,转换为形状相似的英文字母或符号,再加上“首音”就是形声快码。所谓“首音”,是指单字汉语拼音的第一个字母。照此按键,就能输入汉字。(附形声快码键位图)


5.形声快码键盘键位图

  不会汉语拼音的人,可按“形首+形尾+字型”的规则输入。字型分为三种,上下型用“I”代表, 左右型用“U”代表,包含型用“V”代表。

  4.杨氏音形码;发明人:杨志浩(浙江)。

  方案要点:《杨氏音形码》利用汉字的字型信息解决同音混淆问题;利用汉字的字音信息来区分形近的部件;是一个集键盘输入、检索、识字功能为一体,由“形码+音码”构成的汉字编码方案。

  1)键位设计

  (1)形码部分:共设18个码位,其中象形码9个;会意码5个;谐声码1个;形意码3个。

  (2)声码部分:共设声母码18个:B P M F D T N L G K H J Q X Z C S R;韵母码6个: A O E Y W U 。

  2)  编码规则

  ①单字编码规则:X1+X2+Y ,其中X1和X2构成形码部分;Y为音码部分。

  ②词组编码规则:X1+X2+X3+Y ,其中X1、X2、X3构成形码部分;Y为音码部分。

  3)单字拆分原则:整体性原则、一致性原则、对应性原则和模糊性原则。


[1] 载戚桐欣主编《汉字书同文研究》第2辑,台湾中易系统工作室20021月出版。

[2] 二文均载蔡新中、何华珍主编《汉字书同文研究》第5辑,香港文化教育出版社20046月第1版。

[3] 二文均载周胜鸿、陈明然主编《汉字书同文研究》第6辑,香港鹭达文化出版公司20055月第1版。

[4] 载《汉字“书同文”研究》第2辑。

[5] 载《语言文字网》www.yywzw.com/cmr

[6] 5处“(字元)”为作者在本书引用该段文字时所加。

[7] 限于篇幅,只能对各输入法作简略的介绍。读者如对介绍的输入法方案感兴趣,可直接和发明人联系。



上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页   
【内容导航】
第1页:一、简化字整理问题
第2页:二、非对称简繁字研究
第3页:三、非等同异体字研究
第4页:四、同实异形词研究
第5页:五、港台书面语中方言字的使用问题
第6页:六、汉字书同文与计算机汉字信息处理
第7页:七、汉字教学研究
第8页:八、汉字书同文总课题研究
第9页:九、民间研究者提出的汉字优化和汉语拼音方案掠影


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:民间汉字书同文学术沙龙十年历程

下一篇:冯寿忠:我的书同文研究
相关文章       汉字  书同文  非对称简繁字研究  非等同异体字研究 
本文评论
  fv   (zc ,2008-02-18 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章