阅读文章

李牧:繁简“非对称”字组的自动转译实验

1. 提要

[日期:2009-08-27] 来源:语言文字网  作者:李牧 [字体: ]

1. 提要

1.1 定义:

本文所谓“繁体”,泛指台湾规范字;“简体”泛指大陆规范字。“非对称的繁简对应也包括异体关系,笔者刻意不予区分,因为无论它们的关系如何,其解决的方式一样,须化“非对称为“一对一的对应。

1.2 样本:

各家得出的“非对称字组数量有相当差异,其原因除是否包含异体关系之外,还有就是各人所依据的样本资料不同。笔者是以大陆规范《现代汉语通用字表》7000字,以及台湾规范CNS11643常用5401字为主要样本,加上为求二者对应而采录的1700多个台湾次常用字,合计样本字数7376字,共得非对称”270字组(一简对二繁240组,一简对三个以上繁体字30)。字组数量曾依实际情况更新,并用繁简自动对译一一验证无误。

1.3 自动转译的实验:

因为“非对称字组中包括不少异体关系,所以,要解决此项问题,使两岸文字成为一对一的对称,必须彻底解决异体字的分歧,甚至需要两岸文字规范的统合;但这并非短期内能达到的目标。目前海峡两岸交往频繁,繁简字的转译全赖计算机自动转换。以短程目标而言,如果自动对译时没有误译,则即使存在“非对称字组,也不至于影响文意的正确传达。基于这个理念,笔者作了全部270字组自动转译的实验(见文末附表),并假定完全没有词汇的智能设计。转译实验的结果显示:“繁转简时,都没有误译,“非对称字组皆可保持现状;“简转繁时,大部分字组也没有误译,只有18组字出现误译,须作改变。


[1] [2] [3] [4] [5] 下一页   
【内容导航】
第1页:1. 提要
第2页:2.0 自动转译实验的方式及结果
第3页:3.0 某些非對稱字轉譯的調整(举例说明)
第4页:4.0建议剔除的异体字
第5页:5.0 结语


阅读:4177
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:周胜鸿:《简化字总表》中的“非对称繁简字”形音义简析表

下一篇:骆骏 张蓉德:同音替代简繁字琐议
相关文章       繁简之争  第十二次汉字书同文学术研讨会 
本文评论
  你這簡直是亂搞,别扭到底是不要扭還是真正的彆扭呢?背着到底背地裏還是揹著東西呢?   (正我漢字 ,2010-03-12 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名: (限会员登陆后发表评论)

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章  

璺�濠€妯绘睙鐢倸浼愮拹闀愯厬娑擄拷2025楠炵澹�...
璺�濠€妯绘睙鐢倸浼愭稉姘抽敜閺勬挷鑵戠粵澶夌瑩娑擄拷...
璺�濮瑰鐡ф惔鏂垮瀻缁粯鏁奸棃锟�
璺�濠€妯绘睙鐢倸浼愮拹闀愯厬娑撴捁鍨楀妤€瀚嗛悵锟�...
璺�濠€妯绘睙鐢倸浼愮拹闀愯厬娑擄拷2024楠炵澹�...
璺�濠€妯绘睙鐢倸浼愭稉姘抽敜閺勬挷鑵戠粵澶夌瑩娑擄拷...
璺�娑擃厽鏋冮弲顕€鈧俺鐦界拠濠氱叾閺嶅洦鏁為弬鐟扮础...
璺�妤癸附鏁归弮鎯板Ν鐠囩补鈧粓浜ラ垾婵嗙摟
璺�濠€妯绘睙鐢倸浼愮拹闀愯厬娑擄拷2023楠炵澹�...
璺�濠€妯绘睙鐢倸浼愭稉姘抽敜閺勬挷鑵戠粵澶夌瑩娑擄拷...
璺�閹峰ジ鐓堕弬鐟拌埌濮瑰鐡�
璺�閺冦儲鏋冮崑鍥ф倳闂婂磭绀岄崠鏍ф嫲閹峰ジ鐓堕弬锟�...
璺�闂娾晛娴楃拫姘瀮閻ㄥ嫭鏁兼潻锟�
璺�闂娾晛娴楃拫姘瀮閻ㄥ嫭鏁兼潻锟�
璺�闂娾晛娴楃拫姘瀮閻ㄥ嫭鏁兼潻娑崇礄娣囶喛顓归敍锟�
璺�闂娾晛娴楃拫姘瀮閻ㄥ嫭鏁兼潻娑崇礄娑撳绱�
璺�闂娾晛娴楃拫姘瀮閻ㄥ嫭鏁兼潻娑崇礄娑撳⿵绱氶敍锟�...
璺�閹恒垹顕伴垾婊堫浘閳ユ繂鐡х€涙鎮� 鐠囩娀鍣�...
璺�瀵伴攱鏋冮弬鎵锤閺傦拷
璺�闂傜敻缍堟导瀣挤閵嗗﹤鍙氭稊锕傗偓姘モ偓瀣暆娴狅拷
璺�濮瑰鐡ч幏濂哥叾閸栨牗鏌熷鍫濆挤閸忔儼鐦庢潻锟�
璺�鐎电銆冮棅铏瀮鐎涙娈戦崣宥嗏偓锟�
璺�娑撯偓缁夊秵娲挎导妯跨Ш閻ㄥ嫭鏌婇弬鍥х摟閳ユ柡鈧拷...
璺�閺冦儲鏋冮弬鎵锤閺傦拷
璺�閺冦儲鏋冮惄鍙夋瀮缁犫偓娴狅拷