□高浓汉语信息作为电子计算机汉语, 已获国家 发明专利证书(1993中国专利局); 作为汉语文 信息处理, 受到国家语委语用所,北大,云大等 专家学者的高度赞许(1996昆明评审会). □Email: haiqingluo@tom.com <高浓汉语信息>探秘 湖南大学 人文科学系 罗海清 高浓汉语信息只用2-3个字母, 表达汉语1270个带调的音节, 平均音 节长2.3个字母. 例如, glsytgi wwlk iwjn hithi (计算机处理语言信息) 这里仅用20个字母表达了汉语4个词共9个带调的音节(字), 计算它的平均 音节长为: 20÷9=2.22(个字母) 如此高浓的汉语信息有什么用呢? 一是管理计算机的巨大资源, 可按 字母顺序快速查找文件名目录名等; 二是记录计算机极微细的动作, 提高 汇编语言的可读性, 可开发效率极高的核心软件; 三是中文资料的检索与 听打输入等. 汉语会产生如此高浓的信息吗? 我们知道, 汉语拼音字母表示的音节 不带调, 一般拼式也有3-4字母长, 最长达6个字母, 如chuang个(窗); 高 浓汉语信息的每个音节都带调, 拼式反而短到2-3个字母, 这有可能吗? 我们深入研究汉语语音的内在规律, 并充分利用这些规律, 的确实现 了这种高浓缩的汉语信息. 一. 增加汉语拼音的元音字母 汉语拼音36个韵母, 仅由6个元音字母组成, 即: a e i o u ü,其中 ü不能在通用键盘上实现, 汉语拼音里也尽量省略ü头上的两点, 写成如, ju qu xu jue que xue jun qun xun yu yue yun 等, 实际上yu就是ü, 而且拼音教学里把音节开头的y读成i, 如, ya yan yang yao yu 等, 因此我们可以不要ü这个元音字母, 按上述拼写原理, 可以将ü写成双元 音字母的iu, 这样, 汉语拼音的36个韵母, 实际上只由 a e i o u 5个元音 字母来组成了. 但是, 汉语拼音的声母只有21个, 却使用了19个辅音字母, 如, b p m f, d t n l, g k h, j q x, zh ch sh r, z c s 实际上还不够用, 辅音字母h重复使用为: zh ch sh. 汉语拼音跟英语一样, 都是使用26个拉丁字母, 而且都是由元音和辅 音字母组成; 显然, 我们要增加元音字母, 就必须减少辅音字母, 二者的 总数一定要保持在世界通用的这26个字母上. 汉语语音的内在规律, 凡是与 g k h 相拼的韵母, 都不与声母 j q x 相拼; 反过来也一样, 凡是与 j q x 相拼的韵母, 都不与声母 g k h 相拼, 那么我们就可以利用这个规律, 不必要用6个声母, 即6个辅音字母 了; 而且取世界通用的3个辅音字母 g k h, 而舍去不太通用的辅音字母 j q x. 理论上是行得通的, 实际上可行吗? 习惯吗? 我们实际拼一拼吧, gi(鸡) gia(家) gie(街) ki(欺) kia(掐) kie(切) hi(西) hia(瞎) hie(些) ... ... 上述拼式国际上更通用一些, 我们自己拼也不会拼出别的什么字音来. 由此, 汉语高浓信息拼法的声母就只剩18个了, 即: b p m f, d t n l, g k h, v w x r, z c s 其中, v w x 分别表示 zh ch sh, 即v读zh, w读ch, x读sh了. 26个字母, 除去18个辅音字母, 其余就是: a e i o u j q y 8个元音字母了. 其中, j q y 是新增加的3个元音字母, 按照下面讲的韵 母构成方法, 这3个元音字母共构成如下8个韵母: jm [ian] (烟) jo [iao] (腰) ja [iang] (央) ym [uan] (弯) yi [uai] (歪) ya [uang] (汪) qu [iou] (优) qo [iong] (拥) 由这8个韵母可以看得出来, 元音字母j包含了复韵母开头的两个音素ia-, y包含了复韵母开头的两个音素ua-, q包含了复韵母开头的两个音素io-, 由此, 我们可以确定这3个元音字母的读音, 即: j读"呀", y读"哇", q读 "唷". 二. 字母顺序隐含带调韵母的信息 元音字母 a e i o u , 即汉语拼音的单韵母 a e i o u , 因此以元 音字母开头的几个连续字母, 如a-b-c-d, e-f-g-h, i-j-k-l, o-p-q-r, u-v-w-x, 它们各自的字母序1-2-3-4, 即可隐含它们对应单韵母的1-2-3- 4 声, 例如, a-b-c-d : ma(妈) mb(麻) mc(马) md(骂) e-f-g-h : ge(哥) gf(革) gg(葛) gh(各) i-j-k-l : gi(机) gj(极) gk(己) gl(计) ki(欺) kj(其) kk(起) kl(气) hi(嬉) hj(习) hk(喜) hl(戏) o-p-q-r : bo(波) bp(博) bq(跛) br(簸) u-v-w-x : vu(朱) vv(竹) vw(主) vx(注) wu(出) wv(除) ww(储) wx(触) xu(书) xv(熟) xw(属) xx(术). 实际上, 字母顺序隐含的带调韵母信息, 不仅适应于单韵母, 而且适 应于复韵母; 因为许多复韵母都由单韵母组合而成, 我们只要变更复韵母 的末尾字母顺序就行了. 首先, 我们看看上节ü韵分析成的复韵母iu, 是 如何变成带调韵母的: iu韵末尾字母为u, 而单韵u的字母顺序是u-v-w-x, 因此是, iu(淤) iv(于) iw(与) ix(预) giu(居) giv(局) giw(举) gix(具) kiu(区) kiv(渠) kiw(取) kix(去) hiu(须) hiv(徐) hiw(许) hix(序). 然后, 我们再观察几个复韵母末尾字母变声调: o-p-q-r : ao(凹) ap(熬) aq(袄) ar(奥) bao(包) bap(薄) baq(保) bar(报) a-b-c-d : ua(挖) ub(娃) uc(瓦) ud(袜) hua(花) hub(华) huc( ) hud(化) e-f-g-h : ie(耶) if(爷) ig(野) ih(夜) gie(接) gif(结) gig(解) gih(介) kie(切) kif(茄) kig(且) kih(窃) hie(些) hif(协) hig(写) hih(谢) i-j-k-l : ui(微) uj(为) uk(委) ul(位) hui(灰) huj(回) huk(毁) hul(会) u-v-w-x : ou(欧) ov( ) ow(偶) ox(沤) vou(周) vov(轴) vow(肘) vox(宙) wou(抽) wov(酬) wow(丑) wox(臭) xou(收) xov(熟) xow(手) xox(受) 字母顺序隐含带调韵母信息的优点是, (1) 不需要声调符号, 可在通 用键盘上实现; (2) 不用专用字母或数字表示声调, 可使拼式简短, 如, 数字标声调 字顺变声调 _________________________________ 爷爷 早起 : ye2ye2 zao3qi3 ifif zaqkk 花草 绿化 : hua1cao3 lyu4hua4 huacaq lixhud 但是字母顺序隐含的带调韵母, 不直观, 需要分析才能知道是什么韵 母和该韵母的第几声, 例如if, 必须分析出f是[e]韵, 和f是字母顺序e-f -g-h的第2个即第2声; 这样繁琐的分析过程, 显然不能当作一般拼音方法 使用, 使用它需要有一个学习过程, 即直读, 如if直读为'爷', 直拼, 如 h-if直拼为'斜'. 三. 借用长读元音隐含汉语后鼻音ng 汉语的鼻韵母有两种, 一种是以前鼻音n 结尾的前鼻韵母, 一种是后 鼻音ng结尾的后鼻韵母. 分别列表如下. _____________________________________ 前鼻韵母 后鼻韵母 an ang en eng ian ong in iang uan ing uen iong üan uang ün ueng _____________________________________ 按照上一节, 以元音字母结尾的复韵母, 都可以通过字母顺序隐含带 调韵母的信息, 前鼻韵母末尾的前鼻音n 是否也有字母顺序, 隐含带调的 前鼻韵母信息? 这倒不难, 26个字母里, 有两个鼻音 m,n, 而且都是挨着 的字母序; 再增加两个挨着的字母 s,t, 即由m_n_s_t 隐含带调的前鼻韵 母信息, 这也是比较适合和顺理成章的事. 缺点是, 第1声不是n, 而是m, 例如, am(安) an( ) as(俺) at(按) em(恩) en( ) es( ) et(摁) im(因) in(银) is(引) it(印) um(温) un(文) us(稳) ut(问) fam(翻) fan(凡) fas(反) fat(饭) lum(抡) lun(轮) lus( ) lut(论). 这样一来, 为前鼻韵母增加的字母顺序m n s t, 等于新增加了一个 单韵母m. 但是, m并不独立作韵母使用, 这对高浓汉语设计思想来说, 是 一个很大的浪费. 因此, 我们将拼写极多的em(恩)韵, 在拼音时作为单韵 母m使用, 例如, bm(奔) bn( ) bs(本) bt(笨) pm(喷) pn(盆) ps( ) pt(喷) mm(们) mn(门) ms( ) mt(闷) fm(分) fn(坟) fs(粉) ft(奋) gm(跟) gn(哏) gs(艮) gt(亘) km( ) kn( ) ks(肯) kt(裉) hm( ) hn(痕) hs(很) ht(恨) vm(真) vn( ) vs(诊) vt(镇) wm(郴) wn(沉) ws(碜) wt(衬) xm(身) xn(什) xs(审) xt(甚) rm( ) rn(人) rs(忍) rt(任). 至此, 隐含带调韵母信息的字母顺序已包含24个字母, 即: abcd efgh ijkl opqr uvwx mnst, 只剩下yz两个字母, 在汉语拼写方法中, 再也找不到隐含带调后鼻韵母ng 的信息了. 笔者是在1972年发现字母顺序可以隐含带调韵母信息的, 当时 走到前鼻韵母这一步时, 已是脑力耗尽黔驴技穷, 止步数日无从突破; 但 是, 笔者太爱这个字顺隐含调韵信息的发现了, 年轻气盛, 不甘心止于这 一步, 数日后终于从外国拼音文字的长元音读法得到启示. 例如, 德语的 长读元音采用两个元音字母重叠, 如, Waage(秤) Tee(茶) Boot(小船); 日语长元音的读法, 如, ぁ段假名后加ぁ, ぃ段假名后加ぃ, ぅ段假名后 加ぅ, 这也类似元音重叠法. 首先想到这种元音字母重叠, 仅仅是从形式 上考虑后鼻韵的声调问题; 进一步的研究, 元音或单韵母重叠跟后鼻韵母 还有内在联系: 一, 汉语前鼻韵母读音轻而短, 后鼻韵母读音重而长, 因 此, 元音重叠正反映了后鼻韵母读音长的特点; 二, 汉语与日语有历史渊 源关系, 汉语的后鼻音字在日语里几乎都是采用长音读法. 这就给了我们 借用外国语长音隐含带调后鼻韵母的信心; 如果一种拼写法没有理据, 我 们就会失去信心的. 下面我们来看看元音字母重叠, 是如何隐含带调后鼻 韵母信息的? aa - ang ee - eng ii - ing oo - ong uu - ueng aa(肮) ab(昂) ac( ) ad(盎) faa(方) fab(防) fac(访) fad(放) wee(称) wef(成) weg(逞) weh(秤) ii(英) ij(营) ik(影) il(映) kii(清) kij(情) kik(请) kil(庆) too(通) top(铜) toq(统) tor(痛) uu(翁) uv( ) uw(蓊) ux(瓮) 最后, 汉语拼音里还有一个特殊韵母er, 它不参与拼音, 只是当独立 韵母使用. r 结尾的复韵母, 如何隐含带调韵母信息呢? 我们从隐含带调 韵母信息的6段24个字母中, 可以找到第4段opqr, 那么, er韵本身就是第 4声, er韵其他各声按opqr的字母顺序表示如下: eo(儿) ep(而) eq(耳) er(二) 综上所述, 汉语拼音的所有韵母, 都可以由字母顺序隐含带调韵母的 信息了. 四. 用介母紧缩汉语拼音的长韵母 上一节已将所有韵母都规范为 a e i o u m 6个字母结尾了, 并可按 字母顺序隐含带调的韵母信息. 因为高浓汉语的韵母, 包括声调在内最长 不超过2个字母, 那么, 汉语拼音多于2字母的韵母, 就都是长韵母了, 它 们必须用含多音素的介母予以紧缩, 第一节已提到增加的3 个元音字母含 多个音素: j - ia q - io y - ua, 现在还要借用一个元音字母o 包含 iu(�)2个音素; o 兼作介母iu并不会出现麻烦, 因为o 开头的复韵母只有 一个ou(欧), 记住就是, 它不会影响o 开头读作介母iu. 下面列出所有长 韵母的介母紧缩方法表: j(ia-) q(io-) y(ua-) o(iu-) _______________________________________________________ jm(ian) qo(ioo-iong) ym(uan) om(iun-乶) ja(iaa-iang) qu(iou) ya(uaa-uang) oe(iue-乪) jo(iao) yi(uai) oa(iuan-乤n) 这里, 介韵母oa(乤n)省略了后面的前鼻音n, 需要记住, 不要拼写出 有3 个字母的韵母来; 另外, 韵母iu(�)的表示, 跟汉语拼音iou的省略形 式iu相同, 它们完全是不同的韵母, 前者读'淤', 后者读'优', 也需要记 住它们. 因此, 我们尽量多列举介韵母拼读的一些例子: 〖介母j〗 jm(烟) jn(言) js(眼) jt(验) bjm(边) bjn( ) bjs(贬) bjt(便) pjm(偏) pjn(骈) pjs(谝) pjt(片) mjm( ) mjn(棉) mjs(免) mjt(面) djm(颠) djn( ) djs(点) djt(电) tjm(天) tjn(田) tjs(舔) tjt(掭) njm(拈) njn(年) njs(撵) njt(念) ljm( ) ljn(连) ljs(脸) ljt(练) gjm(间) gjn( ) gjs(简) gjt(见) kjm(千) kjn(前) kjs(浅) kjt(欠) hjm(先) hjn(闲) hjs(显) hjt(现) ja(央) jb(阳) jc(养) jd(样) nja( ) njb(娘) njc( ) njd(酿) lja( ) ljb(良) ljc(两) ljd(亮) gja(将) gjb( ) gjc(讲) gjd(降) kja(枪) kjb(强) kjc(抢) kjd(呛) hja(香) hjb(详) hjc(想) hjd(向) jo(腰) jp(摇) jq(咬) jr(要) bjo(标) bjp( ) bjq(表) bjr(鳔) pjo(飘) pjp(瓢) pjq(漂) pjr(票) mjo(喵) mjp(描) mjq(秒) mjr(妙) djo(雕) djp( ) djq(鸟) djr(掉) tjo(挑) tjp(条) tjq(挑) tjr(跳) njo( ) njp( ) njq(鸟) njr(尿) ljo(撩) ljp(疗) ljq(燎) ljr(料) gjo(交) gjp(嚼) gjq(角) gjr(教) kjo(敲) kjp(桥) kjq(巧) kjr(翘) hjo(消) hjp(淆) hjq(小) hjr(笑) 〖介母q〗 qo(拥) qp(喁) qq(永) qr(用) gqo(扃) gqp( ) gqq(窘) gqr( ) kqo( ) kqp(穷) kqq( ) kqr( ) hqo(凶) hqp(雄) hqq( ) hqr( ) qu(优) qv(由) qw(有) qx(右) mqu( ) mqv( ) mqw( ) mqx(谬) dqu(丢) dqv( ) dqw( ) dqx( ) nqu(妞) nqv(牛) nqw(扭) nqx(拗) lqu(溜) lqv(流) lqw(柳) lqx(六) gqu(究) gqv( ) gqw(九) gqx(就) kqu(秋) kqv(求) kqw(糗) kqx( ) hqu(修) hqv( ) hqw(朽) hqx(秀) 〖介母y〗 ym(弯) yn(完) ys(晚) yt(万) dym(端) dyn( ) dys(短) dyt(段) tym(湍) tyn(团) tys(疃) tyt(彖) nym( ) nyn( ) nys(暖) nyt( ) lym( ) lyn(孪) lys(卵) lyt(乱) gym(关) gyn( ) gys(管) gyt(惯) kym(宽) kyn( ) kys(款) kyt( ) hym(欢) hyn(环) hys(缓) hyt(换) vym(专) vyn( ) vys(转) vyt(转) wym(穿) wyn(传) wys(喘) wyt(串) xym(栓) xyn( ) xys( ) xyt(涮) rym( ) ryn( ) rys(软) ryt( ) zym(钻) zyn( ) zys(纂) zyt(钻) cym(撺) cyn(攒) cys( ) cyt(窜) sym(酸) syn( ) sys( ) syt(算) ya(汪) yb(王) yc(往) yd(望) gya(光) gyb( ) gyc(广) gyd(逛) kya(匡) kyb(狂) kyc(夼) kyd(况) hya(慌) hyb(黄) hyc(晃) hyd(晃) vya(装) vyb( ) vyc(奘) vyd(状) wya(窗) wyb(床) wyc(闯) wyd(创) xya(双) xyb( ) xyc(爽) xyd( ) yi(歪) yj( ) yk(崴) yl(外) gyi(乖) gyj( ) gyk(拐) gyl(怪) kyi( ) kyj( ) kyk(蒯) kyl(快) hyi( ) hyj(怀) hyk( ) hyl(坏) vyi(拽) vyj( ) vyk( ) vyl(拽) wyi(揣) wyj( ) wyk(揣)) wyl(揣) xyi(衰) xyj( ) xyk(甩) xyl(帅) 〖介母o〗 om(晕) on(云) os(允) ot(运) gom(军) gon( ) gos( ) got(俊) kom(逡) kon(群) kos( ) kot( ) hom(勋) hon(寻) hos( ) hot(讯) oe(约) of( ) og( ) oh(月) noe( ) nof( ) nog( ) noh(虐) loe( ) lof( ) log(掠) loh(略) goe(撅) gof(决) gog(蹶) goh(倔) koe(缺) kof(瘸) kog( ) koh(却) hoe(靴) hof(学) hog(雪) hoh(血) oa(冤) ob(原) oc(远) od(愿) goa(捐) gob( ) goc(卷) god(卷) koa(圈) kob(全) koc(犬) kod(劝) hoa(宣) hob(悬) hoc(选) hod(旋) 我们要注意介母跟介韵母的区别. 介母就是指单个字母 j q y o, 它 们虽然含了两个韵母音素, 但不能独立作韵母使用,如 j - ia+, y - ua+ , 不能将gia 写作gj, 将gua 写作gy; 介韵母是由介母跟另一个单韵母组 成了复合韵母, 如 q-o-qo(拥), q-u-qu(优), o-m-om(晕), o-e-oe(约), 介韵母是可以跟声母相拼的, 如 hqo(凶) hqu(修) hoe(靴). 但是, 字母o是个借用的介母, 它本身就是单韵母o, 因此, 可以跟声 母相拼: bo(波) bp(博) bq(跛) br(簸) po(坡) pp(婆) pq(叵 pr(破) mo(摸) mp(模) mq(抹) mr(莫) fo( ) fp(佛) fq( ) fr( ) 实际上单韵母o仅跟声母bpmf相拼, 跟其他声母如 dtnl, gkh, vwxr, zcs 都不相拚; 反过来, 复韵母uo只不跟声母bpmf相拼, 而跟 dtnl, gkh vwxr, zcs 都相拼. 我们利用汉语拼音的这一规律, 字母o 可兼任o-uo两 个韵母, 即o与声母bpmf相拼时读单韵母o, 而与其他声母相拼时读复韵母 uo, 例如, uo(窝) up( ) uq(我) ur(握) do(多) dp(夺) dq(躲) dr(舵) ho(豁) hp(活) hq(火) hr(或) vo(桌) vp(卓) vq( ) vr( ) co(撮) cp(矬) cq(脞) cr(错) 至此, 我们就有两个韵母em和uo, 拼音时分别省去了前面的字母e和u , 再加上韵母oa(冤)省掉了后面的音素n, 一共是3个特用韵母, 需要我们 记住它. 五. 高浓汉语信息连词方法 高浓汉语信息的音节都是2-3个字母, 对于1个字母的单韵母音节, 用 e开头, 如 eaej(阿姨); 所有3 个字母的音节都是由一个辅音字母和一个 元音字母开头; 如果一辅一元自成音节呢? 那就要用y隔音, 如 Baylj(巴 黎); 但是整体认读音节vi(知) wi(吃) xi(诗) zi(子) ci(疵) si(思)等 并不要隔音, 如 vixj(知识). 因此, 高浓汉语信息音节的划分异常简单: 任一两个辅音字母, 两个 元音字母, 一元一辅两个字母, 它们都是一个音节; 而其他都是三个字母 的音节了. 最后, 我们用高浓汉语信息连词方法, 写句哲理的话, 鼓励大家为中 国方块文字铺设一条字母文字复线, 为发展我国自己的科学, 而努力去掌 握这种有效的语言工具. Eikih unhud fayvas dou ljybxkai faymij iw wydzar. 一切 文化 发展 都 离不开 发明 与 创造. ____________________________________