閱讀文章

沉重的《通用規范漢字表》

[日期:2009-10-25] 來源:原創  作者:高國鷲 [字體: ]

 

沉重的《通用規范漢字表》

高國鷲

 

今年812日,醞釀八年的《通用規范漢字表》征求意見與廣大讀者見面了,該表的頒布是人們生活中的一件大事,與百姓的生活息息相關,因此對該表“百般挑剔”,是為了能夠經受歷史長河考驗。下面是自己的學習體會,不正確之處請批評指正。

沉重的《通用規范漢字表》

1、該表對《現代漢語常用字表》(1988年)、《現代漢語通用字表》(1988年)進行了修訂與整合。

與以往字表不同的是,《通用規范漢字表》8300字是從近百年來各種刊物數億漢字中統計整理出來的,具有普遍代表性,一般人寫文章縱使有“一筋斗云十萬八千里”想跳出這一范圍都很難,從這一點看《通用規范漢字表》冠以“規范”作用不大;考慮到在特殊領域有可能突破這一界限,因此字表規定“字表以外的字,必要時仍可使用,但宜采用歷史通用字形。”正是開了這一小口,《通用規范漢字表》冠以“規范”意義不大,《通用規范漢字表》與其它字表或字符集等國家標準是等價的。

2、對《簡化字總表》擴充了265個簡化字(原簡化字取消了49個),簡化字類推范圍定為8300字。

1)簡化字擴充不利于海峽兩岸文字的統一,會越走越遠。《通用規范漢字表》是在8年前著手制定,時至今日與8年前相比,海峽兩岸關系已不可同日而語,目前國內很多部門的工作都在致力于維護海峽兩岸統一,所以《通用規范漢字表》的研制是否也應與時俱進,要顧及到海峽兩岸文字的統一。

2)對簡化字類推范圍,《簡化字總表》規定是:“《簡化字總表》并不是一個嚴格封閉型的字表。如果通篇采用的是簡化字,其中個別繁體字在《簡化字總表》中找不到它的簡化字形,而構成該繁體字形的偏旁已經簡化,那么,一般說來,這個繁體字形也應該根據偏旁類推簡化的原則予以簡化。”《通用規范漢字表》規定改為:“……本字表以外的字,不再類推簡化,個別領域確需類推簡化的,需報國家語言文字工作主管部門批準。”

這次把簡化字類推范圍由開放式修改成封閉式,順應了民意,但操作起來有難度,例如寫一篇科普文章投稿,遇到了《通用規范漢字表》之外類推簡化字,報批需要等待多長時間?能獲得批準嗎?不能獲得批準該怎么辦?也不可能是申報一個審批一個,因此這篇文章很可能石沉大海。即使獲得了批準又怎樣?可能一時也打不出字來,因為這涉及計算機字庫補充新造字、漢字輸入法調整、字表修改等一大堆遺留問題。

3)《通用規范漢字表》對簡化字的修改與原《簡化字總表》一樣,也不符合常用趨簡原則。

漢字演化基本規律:(1)主流是常用趨簡,(2)其次是約定俗成。在這里第一條是最基本的,有了這條第二條就很容易實現,漢字就會和諧發展;如果沒有第一條,硬性推行第二條,漢字演化就會偏離軌道,這種簡化就是不完善的,會帶來很多遺留問題。

1956年制定的《漢字簡化方案》之所以得到了人們普遍稱譽,是因為遵循了常用趨簡這一基本原則,因此約定俗成是有成效的。但在后來簡化中,主要是基于下面兩點考慮:(119551015,吳玉章在作文字必須在一定條件下加以改革的報告中指出:“漢字必須改革,要走世界文字共同的拼音方向,在實現拼音化以前,必須簡化漢字,以利目前的應用,同時積極進行拼音化的各項準備工作。”(21960422,中央在關于推廣注音識字的指示中說:“為了加速掃盲和減輕兒童學習負擔,現在的漢字還必須再簡化一批,使每一字盡可能不到十筆或不超過十筆,盡可能有簡單明了的規律,使難寫難認難記,容易寫錯認錯記錯的字逐漸淘汰。”在上述思想指導下制定了《簡化字總表》(含2235個簡化字)。

因此,《簡化字總表》違背了常用趨簡這一基本原則,只是按約定俗成構成的字表,而這種約定俗成是不牢固的,一旦條件發生改變就有可能松動。例如《簡化字總表》對類推簡化是開放式的,這在當時人們可以接受,但是到了五十年后漢字數字化的今天,這需要配備龐大的簡化字庫,人們就不能容忍了,一致要求調整成為封閉式的,我們要吸取這一教訓。然而,《通用規范漢字表》并沒有按常用趨簡這一基本原則進行修改,雖然是把簡化字類推范圍改成了封閉式,但并沒有封死,需要報批。因此,《通用規范漢字表》仍然只是按約定俗成構成的字表,這種約定俗成是否牢固尚需時間檢驗。

3、對地名、人名用字進行了限定。

漢字是個大家族,現代漢語通用字有七八千,傳承字有七八萬甚至更多些,對于通用字人們天天在使用屬活字;對于七八萬傳承字,也要搞活不能成為古董字,當然,讓人們去寫古文、作古詩已經不現實,目前唯一能夠做到的就是姓名用字的放開,雖然在這一領域用字量不大,但卻有利于把傳承字搞活,例如原來稱作生僻字的?、淼、?、昇,正是通過姓名的流通,這次才被收入到《通用規范漢字表》,而該字表一旦頒布,會割斷與傳承字的流通,不利于漢字未來發展。

漢字是和諧的,對其它外來文字具有一定的親和力,也就是漢字可以和字母直接連在一起,這就是字母詞。字母詞主要用于表示事物的形狀、標準、型號、順序等,例如“U形鋼”、“S形轉彎”、“GB”、“IP電話”、“B超”、“X射線”、“卡拉OK”、“A級”、“B樓”、“維生素C”。字母詞的產生是漢語言文字和諧發展的結果,是漢字最大限度為人類服務的表現,順應了民意,很多字母詞已被現代漢語詞典收錄。基本可以認定:字母詞中字母是漢字的延伸,字母詞大量使用屬規范漢字范疇,也符合國家通用語言文字法。

前不久,江西人“趙c”在更換二代身份證時,根據《姓名登記條例(初稿)》規定姓名中不得有字母為由要其改名再辦理,形成一場引起社會各界廣泛關注的姓名權官司,在一審判決中“趙c”勝訴,在二審判決中經過反復協調,“趙c”更改了名字。

這場官司爭論焦點是作為人名“趙c”含有字母,是否屬于規范漢字范疇,是否滿足國家通用語言文字法。這首先要判斷“趙c”是否是字母詞,如果是字母詞,那么“趙c”就屬于規范漢字范疇,也滿足國家通用語言文字法,那怎樣判斷呢?

什么是字母詞?盡管在學術上有爭論,但最基本的衡量標準應是:(1)由漢字和字母組成(也可完全由字母組成);(2)要有一定含意或所指;(3)容易記憶和方便傳播;(4)遵循約定俗成規律。如果按照上述定義標準,“趙c”已經成字母詞了,因此“趙c”中的字母屬漢字延伸,使用屬規范漢字范疇,也符合國家通用語言文字法。

下面再佐證:有三座相似的樓在售樓時稱“樓a”、“樓b”、“樓c”;有同性別三胞胎在玩游戲時稱“趙a”、“趙b”、“趙c”,若前者是字母詞,后者亦應是。

但是,“趙c”能否用于人名是另一回事,換發二代身份證可以拒絕“趙c”用于人名,但不宜以“趙c”不符合規范漢字為由,因此《通用規范漢字表》冠以“規范”,對字母詞的界定容易引起爭議。

如何看待用生僻字或字母起名現象,《通用規范漢字表》采取阻截方式,把起名用字限定在8300字范圍內,這種做法忽視了對新生兒家長的疏導工作。

在給新生兒起名中,用生僻字或字母起名是兩個極端,都不利于孩子的成長。孩子外向又比較聰明,名字中含生僻字,主動讓老師提問的機率比較小,需要一定時間磨合;孩子內向、名字中帶有字母或符號,被動讓老師提問的機率比較大,如果每每答不上來是很尷尬的;而用兩極端中間漢字起的名字叫中性名字,這樣的孩子不靠名字來標新立異,而是要靠自己的努力來求得同學和老師的認同,這對孩子的未來成長大有益處。當然,如果家長喜歡生僻字或帶字母的名字可用作孩子乳名。另外,即使個別家長給子女起生僻字名或字母名,也不要大驚小怪,因為這種名字在社會不會多,而且要冒很大風險,對漢字發展也未必是壞事。

從上面分析可以看出,8年前在制定《中華人民共和國國家通用語言文字法》時,因在學術上對“規范漢字”的定義爭議比較大,因此沒有給予定義,可由有關部門進行解釋。如今在對“規范漢字”進行定義時,也不是《通用規范漢字表》能夠完全涵蓋的。《通用規范漢字表》如果用三個修改后的新版字表:《簡化字總表》、《現代漢語常用字表》、《現代漢語通用字表》表述,這可能會更好些。

《簡化字總表》修改之我見

漢字繁、簡之爭由來已久,幾乎是隨著上世紀五十年代簡化字的制定時就開始了,如今已經爭論了五十多年,這次《通用規范漢字表》一旦頒布,為五十多年的漢字繁、簡之爭畫上了句號,但隨之而來的將是迎接下一個簡化字的五十年,屆時能否避免重新燃起漢字的繁、簡之爭,這是人們最為關切的,下面談談對《簡化字總表》修改的個人見解:

《簡化字總表》分三個表總共2235個簡化字,其中第一表是不作簡化偏旁的350個字,第二表是可作簡化偏旁用的132個簡化字和14個簡化偏旁;第三表是根據第二表類推出來的1753個簡化字,但在實際應用中,對超出總表范圍的字允許類推簡化。

在《簡化字總表》中,按照類推能力的大小,可把類推簡化字分成兩類,一類是類推能力比較弱,例如“備筆邊嘗蟲帶動斷對隊歸龜過畫匯薦節進舉殼靈劉虜鹵錄買遷親窮殺雙獻寫業藝蔭隱猶”,每個都只有一個類推簡化字;另一類是類推能力比較強,例如最強的是“?”可類推出216個簡化字,像這樣類推能力最強的簡化偏旁有12個,按照類推能力強弱分別是“???貝魚鳥車門馬頁?見”,它們總共類推出了1185個簡化字,占《簡化字總表》的53%。因此在《簡化字總表》中,類推簡化字占主體,在類推簡化字中,由這12個簡化偏旁類推出的簡化字占主體。

在人們書寫中,如果一篇文章同時出現上述這12個繁、簡偏旁字,例如“鯉、?”兩字,或“鋼、鑱”兩字,人們肯定不會接受,還有“烏”的繁、簡偏旁字也屬此類。那采用什么方法解決好呢?主要有以下三種(完全恢復繁體字不在本文討論范圍之內)解決方法:(1)能類推簡化的字都隨之簡化;(2)字表外能類推簡化的字報國家語言文字工作主管部門批準;(3)恢復類推功能極強的12個簡化偏旁繁體字形“???貝魚鳥車門馬頁?見”。

上述第一種方法是《簡化字總表》處理方式;第二種方法是《通用規范漢字表》處理方式;第三種方法是筆者提出的《〈簡化字總表〉調整建議方案》?處理方式。

《〈簡化字總表〉調整建議方案》是按常用趨簡原則對《簡化字總表》進行修改。如果人們能夠接受這12個簡化偏旁恢復成繁體字形,那么《簡化字總表》中的2235個簡化字可減少到1050個,這時繁、簡字的邊界在《現代漢語常用字表》與《現代漢語通用字表》之間,這是不可以的。在《簡化字總表》中“厭”的繁體字是“厭”,類推簡化字有6個“懨厴靨饜魘?”,對應繁體字是“懨厴靨饜魘黶”,而這6個類推簡化字都不是《現代漢語常用字表》用字,根據常用趨簡原則這6個類推簡化字可以取消。因為“厭”字類推功能不強,因此在一篇文章中同時出現“厭、懨”兩個字,人們可以接受吧!再如“齒”的繁體字是“齒”,類推簡化字有12個“齔嚙齠齙齟齡齜齦齬齪齷齲”,繁體字是“齔嚙齠齙齟齡齜齦齬齪齷齲”,在類推簡化字中只有“齡”屬《現代漢語常用字表》用字,因此在類推簡化字中只保留“齡”就可以了。這時在一篇文章中同時出現“齒、齡、齲”三個字,人們也可以接受吧!這樣簡化之后,簡化字總數可控制在600個左右,接近于1956年制定的《漢字簡化方案》,類推范圍就可控制在《現代漢語常用字表》3500字范圍內(如不夠用可對常用字表適當擴充)。

按照常用趨簡原則對《簡化字總表》進行修改,雖然是一次較大的“折騰”,卻能保持數百年甚至上千年的相對穩定,不存在遺留問題,因此這種約定俗成是牢固的,從根本上解決了漢字的繁、簡之爭,為海峽兩岸漢字書同文奠定了基礎。當然,一次修改這么多簡化字需要有過渡期,可選用一種(或幾種)報刊用兩種方法分別出版,讓人們逐漸適應,這也是接受市場檢驗。

中華地名、姓氏的保護與規范

中華地名和姓氏歷史悠久,具有傳承性,至今已延續五千年。其選擇是一種文化現象,有獨特的傳播渠道和客觀發展規律,每一個地名、姓氏的背后都能挖掘一個動人的故事,因此具有重要文學藝術價值和科學研究價值,并且至今沒有遭破壞屬原生態資源。

在社會發展進程中,隨著老城區改造,歷史遺存所剩無幾,失去的不能再找回來。隨著計算機、互聯網普及和地籍、戶籍現代化管理,地名、姓氏的保護與開發之間的矛盾也日益突出。《通用規范漢字表》征求意見,就有鄉鎮以下生僻地名和上千生僻孤姓未能收入,意味著這些生僻用字面臨改名的命運,然而,對這些稀有資源今天若不去善待和保護,一旦失去了還能找回來嗎?

《通用規范漢字表》作用有三:一要作齊——整合字表;二要作全——適于各個領域的漢字應用;三要作強——規范之上。這樣地籍、戶籍管理用字也要納入到字表中,因為地籍、戶籍用字歷史悠久,不但多而且雜,含有不少生僻字,為了讓字表不至于急劇膨脹,只能對鄉鎮以下生僻地名和生僻孤姓忍痛改名,這些字將退出流通領域,這與當前漢字編碼弱勢有著直接的關系;而收集到字表內的地名和姓氏用字,為了統一繁、簡字形,新產生了二百多個類推簡化字,這些字的簡化實屬不得已而為之,如果《簡化字總表》能按常用趨簡原則進行修改,也就不存在這一問題了。

關于漢字編碼的反思

漢字編碼,這曾讓人又愛又恨,三十年來不知多少人士(包括軟件公司和個體編碼人)著迷過,為了尋找簡單、快捷的漢字輸入法,也不知傾注了人們多少心血,千呼萬喚始不出。在換發二代身份證時,又推出一些大字符集漢字編碼,但又無一不暗然退出,最終導致把地籍、戶籍用字限定在8300字的《通用規范漢字表》。專家在談該字表對百姓生活影響時指出:有些特別生僻的字,電腦雖然已經編碼,但是輸入法不支持,就是人們常說的打不出來……。

漢字編碼如今真的走到盡頭了嗎?

目前,由于認識上的差異,人們重在制定和推行漢字編碼規范,而對漢字編碼理論研究投入不足,理論滯后于編碼發展,理論與實踐相脫節,這是造成當前漢字編碼雖多但又不適用的根源。例如,很多人都會認為漢字編碼遵循的是約定俗成,這就是漢字編碼規范?闡述的原則,認為規范是不能突破的,只能在規范約束下開展編碼活動。但是,實踐是檢驗真理的標準,三十多年的漢字編碼已經證明,沿著這條路再走下去,前面已經沒路可走了。

其實,漢字編碼是有規律可循的,漢字編碼規范應在漢字編碼規律下的約定俗成。這意味著漢字編碼規范也不是一成不變的,要隨著漢字編碼方法的改進而建立新的規范標準來達到新的編碼統一,而不應是用舊有規范簡單否定。可以肯定地說,只要掌握了漢字編碼規律,人們期待的簡單、方便,不但適用于普通用戶,也適用于地籍、戶籍管理的大字符集漢字編碼方案就一定能產生。現在不清楚的是:這種方法一旦產生了,那對地籍、戶籍管理用字還要限制嗎?

 

注:?見語言文字網(www.yywzw.com

?目前最重要的兩個漢字編碼規范是(1)用于計算機編碼的CF 3001-1997漢字部件;(2)用于手機編碼的GB/T 18031-2000數字鍵盤字母鍵位設定。

 

啟示:

該出山時就出山

 

在“專家談《通用規范漢字表》對百姓生活影響”一文中,教育部領導和兩位文字學家多次談到有些地名、姓氏用字比較生僻,電腦里雖然都有,但一般輸入法不支持。

現在可以告訴大家,由筆者研發的漢字拼形輸入法,已經做到了大字符集字庫與簡單、方便輸入的合二而一,完全支持地籍、戶籍管理中生僻字的簡單輸入,請有關部門及專家審閱。

漢字拼形輸入法按漢字筆順規則表,一次輸入單筆畫或多筆畫漢字結構,這是除了筆畫輸入之外唯一的長碼方案,最大碼長12鍵,從而確保了大字符集(7萬字以上)漢字輸入的簡單化,適宜普及,也為漢字的排序奠定了基礎。在實際應用中,漢字拼形主要是掛接到中值碼輸入法中。

中值碼漢字輸入法用于輸入通用字(7000字以上)和詞組。取漢字的三個要素:漢語拼音首字母,漢字拼形首、尾字母。在輸入中:一鍵是單字簡碼;二鍵是雙字詞簡碼;三鍵是輸入漢字;四鍵是輸入詞組。

中值碼掛接了漢字拼形和漢語拼音。在輸入中,凡遇到讀不出的字(包括生僻字),只要按U鍵,進入大字符集字庫,采用漢字拼形輸入方法;凡遇到寫不出的字只要按V鍵,進入漢語拼音字庫,采用全拼輸入法。掛接的輸入法只能輸入漢字,不能輸入詞組。

中值碼適用于普通用戶日常漢字輸入,作家、記者、教師等語文工作者文章寫作,文字學家、考古工作者古漢語寫作,郵電、金融、交通、地籍、戶籍等部門打字輸入,尤其適用于初學或中老年人漢字輸入。

中值碼漢字輸入法分為:中值碼G、中值碼K、中值碼D三個標準,三者之間區別僅僅在于掛接的漢字拼形版本的不同,中值碼G掛接的漢字拼形是GB2312(含6763字)、中值碼K掛接的漢字拼形是GB13000.1(含20902字)、中值碼D掛接的漢字拼形是GB18030-2005(含70244字)。

中值碼G已經完成、中值碼K接近尾聲,中值碼D近期完成。《漢字拼形輸入法》書稿正在編寫中。筆者研制的最新漢字編碼理論已經寫成了二十多篇論文,目錄附后歡迎查閱交流。

目前中值碼G漢字輸入法近期(年內)可作成互聯網下載軟件,屆時歡迎品嘗。

 

 

目前在《語言文字網》(www.yywzw.com)已發表的文章有:

1 《漢字編碼三大定律》20071213

2 《筆畫組合理論與漢語拼形方案》2008228

3 《數字鍵盤復碼字母鍵位設定原理》2008229

4 《挑戰天下編碼人》2008319

5 《漢語拼形漢字輸入法》200847

6 《漢字編碼——未來推動漢字演化的動力》200866

7 《關于漢字編碼第二次整理探討》200876

8 《論漢字編碼數學原理》2008820

9 《漢字編碼與密碼設置》2008119

10 《漢字編碼與互聯網域名》20081119

11 《漢字編碼與電話號碼》20081221

12 《漢字編碼與郵政編碼》200913

13 《字母異化·數字異化·漢字編碼》2009119

14 漢字編碼——對漢字簡化的“否定”2009217

15 《簡化字總表》調整建議方案200988

16 《阿拉伯數字的遺憾》2009530

17 當前漢字編碼急需解決的十個問題2009613

18 《〈漢字筆順規則表〉修改建議方案》2009617

19 《手機互聯網輸入法》200971

20 《關于“中華姓氏”申報世界非物質文化遺產的倡議》20091023

21 《沉重的〈通用規范漢字表〉》20091025

 

近期要發表的文章有:

22 《遭遇漢字編碼危機》

23 《漢字(編)碼的最終歸宿》

24 《漢字拼形輸入法簡介》

 




閱讀:
錄入:

語網特別申明:各專欄專輯作者文責自負,對自己的作品享有完整版權,在語網的發布不影響其再版權,即作者還可另行投稿或出版。任何人均可在本站發布或轉載文章,但這并不意味著本站贊同其觀點或證實其內容的真實性,如涉及版權等問題,請作者來函聯系。

評論 】 【 推薦 】 【 打印
上一篇:關于“中華姓氏”申報世界非物質文化遺產的倡議

下一篇:遭遇漢字編碼危機
相關文章       漢字編碼三大定律 
發表評論


點評:
 
字數(限500字,建議200字以內):
姓名:

  • 尊重網上道德,遵守中華人民共和國的有關法律法規
  • 承擔一切因您的行為而導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
站內查詢



 
最新文章