阅读文章

简繁汉字的源流、转换与应用

[日期:2015-03-14] 来源:中国教育报  作者:史晓东 [字体: ]

2015年02月26日

  汉字是中华民族使用的文字,具有3000多年的历史。汉字字形的基本趋势是从繁难向简易演化。

  汉字简化的系统性工作从民国时期就开始了。1935年8月,国民政府教育部正式公布第一批简体字表,共计324个,主要选择社会上比较通行之简笔字代替难写的汉字。虽然由于戴季陶等的反对,该方案被搁置,但对中国大陆50年代的《汉字简化方案》产生了重要影响。1956年,《汉字简化方案》发布,1964年出版《简化字总表》,自此简化字成了大陆的标准。而中国台湾仍然采用传统汉字。

  由于政治上的对立和分隔,海峡两岸的文化交流在上世纪80年代之前几乎处于停滞状态,致使两岸语言文字在使用习惯上形成了一定差异,包括字音、拼读系统、标点符号、书写系统、词汇、语法以及版式等方面。信息化方面,两岸在汉字编码和输入法方面也有很大不同。据统计,《简化字总表》第一表350个简化字,两岸字形相差甚远、看不出关联性的字有90余个,如“出[齣]”“丛[叢]”等,约占此表的25.7%,导致两岸民众在阅读对方文字时产生一定困难。近年来,随着互联网快速普及以及两岸政治、经济、文化交流的日益频繁,简繁自动转换的重要性愈加凸显。

  2009年,第五届两岸经贸文化论坛提出两岸合作开发汉字简繁转换系统的共同建议。2012年底,教育部、国家语委正式启动这一项目。2013年初,在中国中文信息学会举办的汉字简繁转换软件评测中,厦门大学开发的系统取得第一名。因此,教育部、国家语委决定由厦门大学牵头、联合教育部语言文字应用研究所和北京师范大学进行汉字简繁转换系统研发,计算机专家和语言文字专家联合攻关。

  项目组对“一简对多繁”汉字、两岸常用词语、专业术语、标点符号等问题进行了深入研究,采用机器翻译技术解决简繁转换问题,既考虑到歧义字的上下文,也考虑了转换的概率。两者都可通过大规模繁体语料库来进行机器学习。同时,由于现代的台湾繁体的字形和语言用法与古籍也有一定差异,因此需区分面向中国台湾的转换和面向古籍的转换。通过研制人员不懈努力,“汉字简繁文本智能转换系统”终于研发成功。该系统功能完善,性能稳定,简体到繁体字级别转换准确率达到99.9%。用户可通过三种方式使用该系统:一是直接打开“汉字简繁文本智能转换系统”网站使用网页版;二是安装“汉字简繁文本智能转换系统”插件,在Word中联网使用;三是拷贝“汉字简繁文本智能转换系统(单机版)”到电脑,可使用更多功能。

  “汉字简繁文本智能转换系统”免费提供社会使用,这必将促进两岸在科技、文化、教育、经济等领域的交流合作。(史晓东 作者系厦门大学教授)

    《中国教育报》2015年2月26日第2版




阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:谷歌推广东话输入法 引起南北语言大战

下一篇:汉字繁简争论:眼光应向前看
相关文章       繁体字  简繁字  简繁字转换 
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章