“和谐全拼”汉字输入法*
陈明然 胡百华
图为
“和谐全拼”汉字输入法是由香港中国语文学会(联繫人胡百华)提出创意,由陈明然开发製作的“和谐体”试验软件。目前有0.1和0.2两個版本。0.1版供我国内地用户在简体版Windows环境中使用;0.2版供我国港澳台地区用户在繁体版Windows环境中使用。
一、 释名
“和谐全拼”中的“和谐”,即“和谐体”之意。“和谐体”是指调整了非一一对应简繁字,实现了简繁汉字一一对应的汉字集。“全拼”中的“拼”即汉语拼音;“全”是指在输入一個汉字时,打该字汉语拼音的全部字母。
二、“非一一对应简繁字”字组
“非一一对应简繁字”,是指一個简化字对应于两個或者两個以上繁体字的汉字。
非一一对应简繁字的字组数,学界還未有完全一致的意见。本输入法暂按《語文建設通訊》编辑部和陈明然提出的两個非一一对应简繁字表的交集,即两個字表中相一致的字组稍加增减確定。
《語文建設通訊》编辑部的字表见该刊第95期,2-4页;
陈明然的字表见《語文建設通訊》第94期,20页。
在上述交集基础上,另加《简化字总表》中的“篱籬”及《第一次异体字整理表》中的“采採、吊弔、杆桿、栗慄、它牠、挽輓、游遊”7组,减去两個字表中原来均有的“坝壩、饥饑、荐薦、体體、药藥、证證”6组,计123组。具体字组罗列如下:
肮骯、摆擺襬、板闆、辟闢、表錶、别彆、卜蔔、才纔、采採、厂廠、冲衝、虫蟲、丑醜、出齣、当當噹、党黨、淀澱、吊弔、冬鼕、斗鬥、恶惡噁、发發髮、范範、丰豐、复復複、干乾幹、杆桿、个個、巩鞏、谷穀、刮颳、广廣、柜櫃、合閤、后後、胡鬍、划劃、坏壞、回迴、汇匯彙、伙夥、获獲穫、几幾、家傢、价價、姜薑、借藉、尽盡儘、据據、卷捲、克剋、夸誇、困睏、腊臘、蜡蠟、累纍、漓灕、篱籬、里裏、历歷曆、栗慄、帘簾、了瞭、卤鹵滷、么麽、霉黴、蒙矇濛懞、弥彌瀰、面麵、蔑衊、苹蘋、扑撲、仆僕、朴樸、千韆、签簽籤、秋鞦、曲麯、确確、舍捨、沈瀋、术術、松鬆、苏蘇囌、它牠、台臺檯颱、坛壇罎、听聽、涂塗、团團糰、挽輓、万萬、系係繫、吓嚇、纤縴纖、咸鹹、向嚮、须須鬚、旋鏇、叶葉、医醫、佣傭、踊踴、游遊、余馀餘、吁籲、郁鬱、御禦、愿願、云雲、芸蕓、脏臟髒、折摺、征徵、症癥、只隻衹、制製、致緻、钟鐘鍾、种種、朱硃、筑築、准準。
三、字符集
GBK(汉字内码扩展规範)字符集(21003個汉字)。
四、对“非一一对应简繁字”的处理
对于第二节所列各组非一一对应简繁字,原则上均按简、繁分化处理,取消各字组中简、繁字之间的对应关係,恢復各简、繁体字的传统字义。其中:
1. 同音(音近)合并简化的“摆擺襬、当噹當、恶惡噁、发發髮、复復複、汇匯彙、获獲穫、历歷曆、卤鹵滷、弥彌瀰、签簽籤、苏蘇囌、坛壇罎、团團糰、纤縴纖、须須鬚、脏髒臟、钟鐘鍾”18组,保留“摆、当、恶、发、复、汇、获、历、卤、弥、签、苏、坛、团、纤、须、脏、钟”等18字分别为“擺、當、惡、發、復、匯、獲、歷、鹵、彌、簽、蘇、壇、團、縴、須、臟、鐘”等18字的简化字;恢复“襬、噹、噁、髮、複、彙、穫、曆、滷、瀰、籤、囌、罎、糰、纖、鬚、髒、鍾”18字的传统字义。
2. 取消“尽—盡儘”、“余—馀餘”2组各组内部的繁简对应关係。保留“尽”、“馀”分别为“盡”、“餘”的简化字,“儘”类推简化为“侭”。
3.“划劃”一组,“计划、规划、策划”等词,《現代漢語詞典》(繁体字版)作“計劃、規劃、策劃”;《國語日報辭典》作“計畫、規畫、策畫”。本方案处理为“计(画/劃)、规(画/劃)、策(画/劃)”两可,由用户按個人习惯选用。“比划”的正写应为“比画”(繁体作“比畫”),也作“比劃”。另有若干其它字组的词语也仿此办法作两可处理。
4.“郁鬱”一组,“郁鬱”有时相通,如“蓊郁”也作“蓊鬱”。本方案作分化处理:
“郁”用于表示“茂盛”义,如“蒼郁、浓郁、蓊郁、郁郁葱葱”等;
“鬱”用于表示“忧愁、气愤”义,如“鬱闷、忧鬱、鬱积、抑鬱、荫鬱、鬱热、鬱血、鬱悒、沉鬱、鬱金香、鬱鬱寡欢”等。
5.“帘/簾”一组,“帘/簾”二字都可用于“窗帘(簾)、门帘(簾)”等词。本方案以“窗帘(簾)、门帘(簾)”的材质和结构加以区分:
凡是布製无空缝的用“帘”,如“酒帘”、“布门帘”、“帘布”等;
凡竹製或者带空缝的用“簾”,如“竹门簾”、“簾子布”等。
6.关于词型“×里(裏/哩)××”。
在词型“×里(裏/哩)××”裏,“里”或“裏”是一個衬字,很难说在哪個词中一定要用“里/裏”中的哪個字。本方案尝试侭量按词义作分化处理。其中:象声词用“哩”,如“噼哩啪啦、嘀哩嘟噜、稀哩哗啦、嘁哩喀喳”等等;其他一概用“裏”,如“糊裏糊塗、流裏流气、曲裏拐弯、土裏土气、稀裏糊塗”等等。
另外,“裏/裡”二字,港澳台人士近来似乎多用“裡”;大陆人都沿用“裏”。本方案依據《第一次异体字整理表》,以“裏”为正字。
五、输入规则
⒈ 本输入法採用汉语拼音输入。输入码为小写26個汉语拼音字母(和拉丁字母相同);拼音字母“ü”用字母“v”代替。
⒉ 重码选择键为十個阿拉伯数符键;“=”和“-”为重码选字区翻页键。敲“=”键翻至後页;敲“-”键翻至前页。
⒊ 本输入法为全拼输入,输入时打每個字汉语拼音的全部字母。
可以按单字输入,也可以按词组输入。词库带有67000多条词组。对非一一对应简繁字的调整主要体现在词组中。如敲“chufa”,输入“出发”;敲“toufa”,则输入“头髮”;敲“ganzao”,输入“乾燥”;敲“ganhuo”,输入“幹活”;敲“ganshe”输入“干涉”;如此等等。为了充分体现“和谐体”特点,在使用中请侭量採用词组输入。
⒋ 本输入法最大码长为
(1)刚好
(2)不够
(3)超过
(4)词组最长为5字。超过5字的词组可分为两段输入。如“五十步/笑百步”、“可望而/不可及”、“无所不用/其极”、“成也萧何/败也萧何”、“三天打鱼/两天晒网”等等。
六、重码字词排列顺序
重码(同音)字词按照先单字後词组的顺序在选字区显示;其中单字按常用字、非常用字、繁体字、异体字(少数异体字空缺)的顺序排列;词组按拼音序排列。(这裏所称“繁体字”是指《简化字总表》中所列的繁体字;“异体字”是指《第一次异体字整理表》规定淘汰的异体字。)
凡遇本文第二节所列的非一一对应简繁字,同一组内的简繁字连续排在一起。
七、版权声明
“和谐全拼”词库由胡百华、陈明然共同设计框架;陈明然实施製作。 MB文件和IME文件采用网友hhhhwwww提供的改进版输入法生成器生成;0.1版安装包採用冰凌提供的冰凌输入法安装程序生成器生成;0.2版安装包採用WinRAR生成;网友唐捺之提供了技术资料;秦皇岛市李克国为词库做了校对。在此对以上所及提供帮助者一并表示感谢!
“和谐全拼”输入法软件版权为香港中国语文学会所有;词库著作权为胡百华、陈明然共同所有,受著作权法及其他相关法规保护。
“和谐全拼”汉字输入法为免费软件,请勿用于商业目的。侵权必究。
八、结语
製作“和谐全拼”汉字输入法是出于两个现实目的:一是打破简体和繁体的对立僵局,让简体和繁体和谐互补,促使“中华同文”迈出稳实的一步;二是消除此前计算机简繁互转中出现的一些有碍準確表达文义以及有损文化传统的错误和混乱。
从语言的实际功能而言,规範汉字(含简化字)文本或是传承汉字(含繁体字)文本,都是承载中华多样文化的“中文/汉语书写系统”。就目前的现状,不管规範(简化)汉字还是传承(繁体)汉字,都有其长处和不足。我们深感有提出“简繁和谐体”的必要,因为简繁和谐体文本不仅兼有方便和準確的功用,还可以经由计算机,转换为合乎国家规定的规范(简化)字文本,或者可予接受的传承(繁体)字文本。
“和谐全拼”汉字输入法是一個非一一对应简繁字的调整试验,主要供学術研究和海内外试验採用“和谐体”排印的中文刊物使用;欢迎有需要的人士在個人场合使用。作者在此倡议:香港中国语文学会和内地书同文研究学术沙龙的同仁以及所有赞同“和谐体”的人士,在個人书信、电子邮件、网上论坛发帖等场合,都尝试使用“和谐全拼”输入软件,按照“和谐体”方案(草案)打字,以实际行动推动汉字书同文运动的发展。作者同时也明確指出:在我国的一般场合,应该使用国家规範汉字。
目前这個“和谐全拼”汉字输入法还只是试用版,还需要不断完善。本软件词库界定并作了调整的非一一对应简繁字组也还只是一個大体的轮廓,并未完全確定。我们仍然在思考如何做到更加準確。某些词语、甚至输入法名称的用字,也还可能存在需要斟酌之处。热忱期望使用这個输入法的单位和人士,把在使用过程中发现的问题随时记下来并反馈给我们。我们将会不断地对她进行修改,使之日臻完善。
反馈意见收件电子邮箱:163wzcmr@163.com 。(全文完)
【注】“和谐全拼”的安装压缩包网址为: http://www.pkucn.com/viewthread.php?tid=261961&extra=page%3D1
欢迎下载试用!下载前请先注册、登录。
需要的人士也可发电子邮件向同文工作室索取。
*本文由作者在《“和谐体拼音输入法”研製情况介绍》(载《語文建設通訊》96期)和《“和谐全拼”汉字输入法说明》(载“和谐全拼”软件光盘或压缩包)两文基础上增删而成,并採用“和谐体”排印。
陈明然:浙江温州学者
E-mail: 163wzcmr@163.com;
胡百华:香港《语文建设通讯》主编
E-mail:huipai@hotmail.com