閱讀文章

信息時代的漢文字優化與漢字書同文

[日期:2008-05-13] 來源:  作者:陳明然 [字體: ]

信息時代的漢文字優化與漢字書同文[1]

漢字書同文,是漢文字學界近年來比較關注的課題。

在當今信息時代,討論漢字書同文問題,必然要和漢文字的信息處理緊密地聯系在一起。書同文研究中的一個重要課題——非對稱簡繁字問題,就是在計算機漢字處理領域的簡繁轉換中被提出來的。

統一兩岸四地的漢字,以什么作為標準?詹鄞鑫教授提出:“評判漢字改革的過去和放眼漢字整理的未來,都必須以計算機漢字信息處理和交流的效率作為最首要的標準。”[2]本文無保留地支持詹教授的這一觀點,認為統一兩岸四地的漢字,應以是否有利于漢文字的計算機處理為標準;也就是說,應以是否有利于解決信息時代漢語言記錄符號和記錄工具的矛盾[3]為標準。任文先生也曾講到:“信息時代,文字不能脫離電腦和漢字編碼而存在,書同文應與‘字同碼’相結合,‘文字規范’應與‘編碼規范’相促進。”[4]所以,同一漢語語素的記錄符號,目前的大陸規范字形和臺灣標準字形,哪一個附合“有利于解決信息時代漢語言記錄符號和記錄工具的矛盾”這個標準,就應以哪一個作為“統一標準字形”。

比如“眾(?)”字,大陸的規范字形“眾”,字元間界線清楚,很容易分解,字元的讀音信息明確,可以很方便地對其實施鍵盤編碼輸入,而且字理明白,筆畫少,手寫也很方便;而臺灣目前的標準字形“?”,相比之下就不如大陸字形好。又如“絲()”字,大陸簡化后的字形“絲”,是一個連體字元[5],雖然可以也還可以方便地對其分解后應用于鍵盤編碼輸入,但按照這個字形進行的分解不符合“十忽為絲,糸五忽也”[6]這個字理,不利于識字教學;而臺灣現行字形“絲”,就符合這個字理,有利于識字教學,同時也可以方便地分解后應用于鍵盤編碼輸入。從計算機信息處理的角度出發對二者進行比較,“絲”要優于“絲”。

在對異體字的處理上,兩岸四地哪一方規定的“正體”字更附合信息處理的要求,就應以這個字形為“統一標準字形”;如果某一個原已作為“異體字”淘汰的字形比之選為“正體字”的字形更附合信息處理的要求,就應該把二者換位;即把原“異體字形”扶正,把原“正體字形”淘汰[7]。如“糴(糴)”字,大陸把“糴”簡化為“糴”,即取“糴”為規范字;臺灣則取“糴”為正體字,把“糴”定為“糴”的異體字。應該說,“糴”的兩個字元界線分明,讀音明確,整字的字理也很清楚,書寫又方便,比“糴”要好;但如果采用“糴”作為正體會引起編碼沖突[8]的話,那就需要考慮采用“糴”為正體了。因為“糴”有“入、米、羽、隹”4個字元,比只有“入、米”兩個字元的“糴”多了2 個字元,相應編碼元素也就多了2個,發生編碼沖突的可能性要比用“糴”作正體字小。

對于雙方的等同異體字,本文認為也應該按“有利于解決信息時代漢語言記錄符號和記錄工具的矛盾”這一原則重新調整。如“蠹(?)”,目前雙方都把“蠹”作為正體字。筆者則贊同林夫先生用“?”作正體字的主張[9]。對比“?”和“蠹”兩個字形,很顯然,“?”非常容易分解,而且字理清楚,筆畫也少,好記好寫,不僅方便計算機鍵盤輸入編碼,也有利于識字教學和手工書寫[10]

同一漢語語素的現行字形和歷史字形二者,也應該按上述原則處理。如果歷史字形比之現實字形更附合于信息處理的要求,那就應該取歷史字形為“統一標準字形”。許多專家學者提出的“非對稱簡繁字”[11]和本文作者提出的“連體字元”[12]等就都屬于這種情況。對于大陸來說,“非對稱簡繁字”中的繁體字即是其所對應簡體字的歷史字形。為了實現簡繁之間的正確轉換,就需要恢復這些繁體字的使用,將其歸入“統一標準字形”之列。又例如“曹”字,現在使用的這個字形,上方的“ ”是一個連體字元,是把兩個“”簡省后又連體而成。這就模糊了字元之間的界線,在計算機鍵盤輸入編碼中不易分解;而其歷史字形之一“ ”,其三個字元相互之間徑渭分明,很容易分解,而且對它的分解不會破壞字理[13]

需要說明的是:前面所舉的幾個字例,只是為了幫助說明筆者“漢字書同文應以是否有利于漢文字的計算機處理為標準”這一主張,并不是筆者對相關單字調整的最后學術建議。

要實現書同文,就不可避免地要對兩岸四地當前使用的部分漢字的字形作不同程度的改變調整。這個改變調整,是在信息時代這一時代環境中進行的,因此,漢字書同文,是包含在信息時代的漢文字優化范疇之內的,必須和漢文字的信息處理統籌考慮。

計算機處理漢字的原理,決定了無論兩岸四地中的哪一方,都不能只是就字形而論字形了。這是因為,對任何一個漢字字形的改動,都將涉及到信息處理用漢字編碼字符集的調整和新老標準的兼容性問題;都將涉及到宋、楷、黑、仿宋、行書……等等各種字體字模庫的調整及兼容性問題;都將涉及到相關計算機中文應用軟件的兼容性問題;甚至還將涉及小學識字課本的改編問題……,等等,等等。這已經不單單只是漢文字學單一學科的研究課題了,而是一個涉及多學科的龐大的系統工程,將牽一發而動全身。

信息時代漢文字優化以及漢字書同文課題的這一重要技術特點,要求我們在討論漢字字形的調整時,必須多學科聯合,多方面論證。只有在取得學術上[14]真正成熟的,技術上真正切實可行的,并得到兩岸四地一致認可的整體方案之后,才能最后通過行政手段在包括計算機漢文字處理領域在內的各個漢字使用領域正式推行之。在這之前,各方對現行漢字體系欲做的一致的調整,或任何一方對現行漢字體系欲作的與其他方不相同的單方面的調整,最好都只限于學術討論范圍之內,以免造成漢文字使用上的新的書不同文現象,造成漢文字使用上的混亂和人力、財力的大量浪費,除非調整后所采用的新字形已在現行計算機字符集中存在。在進行學術討論的同時,可以先在手寫領域中試行。手寫試行期,正好可以作為新老漢字體系的過渡期。但這并不是說,我們可以消極等待;恰恰相反,正是由于漢文字優化課題所面臨的這一新的時代特征,正是由于涉及學科之多,涉及技術之復雜,而決定了研究對象的廣度和深度都將是空前的,這就需要我們以更加高昂的熱情和嚴謹的學風,以更加好學的精神,和時不我待的緊迫感,更加奮發、積極地投身于信息時代的漢文字優化和漢字書同文研究事業之中,在最后實現符合信息處理要求的漢字書同文的時機到來之前,通過廣泛的討論和手寫領域的試驗,作好學術上和社會心理上的充分準備,以便能夠在這一時機到來之時,及時拿出比較成熟的學術建議方案[15]

 

[1] 本文是筆者為在七研會上宣讀的論文《論信息時代的漢文字改革》加寫的一章。《論信息時代的漢文字改革》全文,可以登錄《語言文字網》(www.yywzw.com/cmr)閱覽。

在《論信息時代的漢文字改革》一文中,筆者主要是論述了以下幾個問題:

一、漢語言記錄符號和記錄工具的矛盾運動,是漢文字形體演變的直接動因,每一種新的記錄工具的普及使用,都必然會促使漢文字形體發生新的演變;

二、信息時代,漢語言記錄符號和漢字信息處理新工具——電子計算機的矛盾是主要矛盾;

三、信息時代漢文字改革的主要任務,不是拉丁化;也不是單純的繼續簡化,而是要原表意文字大框架內對當代通行的漢文字進行適度改革使之適應計算機處理的需要。

上述文章發表三年來,通過與網友的討論,以及與書同文沙龍同仁的交流,對一些問題有了一些新的思考:如原來的文題《論信息時代的漢文字改革》中的“漢文字改革”這一提法,習慣上一般是和漢字的拉丁化聯系在一起的。拙文既然是主張在“表意文字大框架”內對漢字進行調整,就不宜用“改革”這一提法,所以現在改為“漢文字優化”;再有就是,《信息時代的漢文字優化》和漢字書同文到底有什么聯系?這種聯系又有什么具體內容?于是就有了今天要提出來和各位討論并向各位請教的這篇短文。

[2] 詹鄞鑫在《簡化字問題學術研討會》上提交的論文,李祿興主編《漢字書同文研究》第4輯,香港鷺達文化出版公司2003年7月第1版或,載史定國主編《簡化字研究》,商務印書館2004年版。

[3] 有關“信息時代漢語言記錄符號和記錄工具的矛盾”,請參閱陳明然《論信息時代的漢文字改革》,載www.yywzw.com/cmr 。

[4] 見任文《漢字“書同文字之大思考”》,載馮壽忠主編《漢字書同文研究》第3輯,香港華夏文化出版有限公司2002年8月第1版。

[5] 關于“連體字元”,請參閱陳明然《連體字元小議》,載蔡新中、何華珍主編《漢字書同文研究》第5輯,香港文化教育出版社2004年6月第1版。

[6] 徐鍇?傳:“一蠶所吐為忽,十忽為絲,糸五忽也。”

[7] 參閱陳明然《從漢文字的信息處理看異體字整理》,載www.yywzw.com/cmr。

[8] “編碼沖突”是指2個或2個以上漢字的編碼相同。編碼沖突會使輸入速度降低,在漢字的計算機鍵盤輸入中應該盡量避免。

[9] 參見林夫《從漢字簡化說到“蠹”字》,載沈克成主編《漢字書同文研究》第1輯,氣象出版社2001年9月第1版。

[10] 《第一批異體字整理表》中沒有這一組字,但《辭海》和《現代漢語詞典》都把“?”作為“蠹”的異體字;1990年重排的《新華字典》也把“?”作為“蠹”的異體字。《漢語大字典》四卷2908頁,“蠹”條:《說文》:“蠹,木中蟲,從  (音k?n,作者注),橐聲。?,蠹或從木,象蟲在木中形。”2877頁“?”條:同“蠹”。并引梁啟超《節省經費問題》:“?日蛀木,木腐而?安棲?”

[11] 關于“非對稱簡繁字”,請參閱陳明然主編《民間漢字書同文研究十周年紀念文集》中的《非對稱簡繁字研究》部分。香港鷺達文化出版公司2007年8月第1版。

[12] 參見陳明然《連體部件小議》,載《漢字書同文研究》第5輯,香港文化出版有限公司2004年6月出版。實際上前面論及的“絲”也是連體字。

[13] 《漢語大字典》卷二第1289頁“  ”條:“  ”,音(一)cáo,義為“周匝,一周天”。《字彙補·木部》:“  ,《說文先訓》:一周天也。”明代楊慎《丹鉛續錄·字義》:“  ,周?也,自東而復于東,故從兩東” 。《說文·東部》“  ”條:“  ,二東。曹從此闕。”徐灝注箋,灝按:“‘  ’、‘  ’相承,增‘曰’字,隸作‘曹’”

[14] 這里所講的“學術”,已不是單學科意義上的“學術”了,而是指漢語言學、漢文字學和計算機科學以及所涉及的所有學科的“學術”了。

[15 ] 本文寫好之后,在等待第十次漢字書同文學術研討會召開的日子里,一次偶然的機會,讀到了上海華東師范大學詹鄞鑫教授的相關論述。詹教授寫道:“在目前的狀況下,漢字字形問題已經跟計算機字符集捆綁在一起了,它要管的主要不是手寫文字,而是計算機文字,文字一動,就會牽涉到計算機字符和國際標準的修改,緊跟著的就是漢字輸入軟件的全面改動,還會涉及常用漢字字頻調查的改變和一系列相應的改變。”同時,詹教授還講到:“我們作為書生,要盡自己的責任,不是去等待時機,而是要促進統一,做好學術上的準備。”




閱讀:
錄入:陳明然

語網特別申明:各專欄專輯作者文責自負,對自己的作品享有完整版權,在語網的發布不影響其再版權,即作者還可另行投稿或出版。任何人均可在本站發布或轉載文章,但這并不意味著本站贊同其觀點或證實其內容的真實性,如涉及版權等問題,請作者來函聯系。

評論 】 【 推薦 】 【 打印
上一篇:漢字定量之我見

下一篇:一個繁體字對應多個簡繁字字組細探
相關文章       漢字  書同文 
本文評論
  書同文應兼顧書寫與鍵入,應兩岸四地民眾通盤考慮,應兼顧字理的一貫性和適當的創新性   (劉學中 ,2009-02-11 )
發表評論


點評:
 
字數(限500字,建議200字以內):
姓名:

  • 尊重網上道德,遵守中華人民共和國的有關法律法規
  • 承擔一切因您的行為而導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
站內查詢



 
最新文章