1. 提要
1.1 定义:
本文所谓“繁体”,泛指台湾规范字;“简体”泛指大陆规范字。“非对称”的繁简对应也包括异体关系,笔者刻意不予区分,因为无论它们的关系如何,其解决的方式一样,须化“非对称”为“一对一”的对应。
1.2 样本:
各家得出的“非对称”字组数量有相当差异,其原因除是否包含异体关系之外,还有就是各人所依据的样本资料不同。笔者是以大陆规范《现代汉语通用字表》7000字,以及台湾规范CNS11643常用5401字为主要样本,加上为求二者对应而采录的1700多个台湾次常用字,合计样本字数7376字,共得“非对称”270字组(一简对二繁240组,一简对三个以上繁体字30组)。字组数量曾依实际情况更新,并用繁简自动对译一一验证无误。
1.3 自动转译的实验:
因为“非对称”字组中包括不少异体关系,所以,要解决此项问题,使两岸文字成为”一对一”的对称,必须彻底解决异体字的分歧,甚至需要两岸文字规范的统合;但这并非短期内能达到的目标。目前海峡两岸交往频繁,繁简字的转译全赖计算机自动转换。以短程目标而言,如果自动对译时没有误译,则即使存在“非对称”字组,也不至于影响文意的正确传达。基于这个理念,笔者作了全部270字组自动转译的实验(见文末附表),并假定完全没有词汇的智能设计。转译实验的结果显示:“繁转简”时,都没有误译,“非对称”字组皆可保持现状;“简转繁”时,大部分字组也没有误译,只有18组字出现误译,须作改变。
【内容导航】 |
第1页:1. 提要
|
第2页:2.0 自动转译实验的方式及结果
|
第3页:3.0 某些非對稱字轉譯的調整(举例说明)
|
第4页:4.0建议剔除的异体字
|
第5页:5.0 结语
|