信息時代的漢文字優化與漢字書同文[1]
陳明然
一
漢字書同文,是漢文字學界近年來比較關注的課題。
在當今信息時代,討論漢字書同文問題,必然要和漢文字的信息處理緊密地聯系在一起。書同文研究中的一個重要課題——非對稱簡繁字問題,就是在計算機漢字處理領域的簡繁轉換中被提出來的。
統一兩岸四地的漢字,以什么作為標準?詹鄞鑫教授提出:“評判漢字改革的過去和放眼漢字整理的未來,都必須以計算機漢字信息處理和交流的效率作為最首要的標準。”[2]本文無保留地支持詹教授的這一觀點,認為統一兩岸四地的漢字,應以是否有利于漢文字的計算機處理為標準;也就是說,應以是否有利于解決信息時代漢語言記錄符號和記錄工具的矛盾[3]為標準。任文先生也曾講到:“信息時代,文字不能脫離電腦和漢字編碼而存在,書同文應與‘字同碼’相結合,‘文字規范’應與‘編碼規范’相促進。”[4]所以,同一漢語語素的記錄符號,目前的大陸規范字形和臺灣標準字形,哪一個附合“有利于解決信息時代漢語言記錄符號和記錄工具的矛盾”這個標準,就應以哪一個作為“統一標準字形”。
比如“眾(?)”字,大陸的規范字形“眾”,字元間界線清楚,很容易分解,字元的讀音信息明確,可以很方便地對其實施鍵盤編碼輸入,而且字理明白,筆畫少,手寫也很方便;而臺灣目前的標準字形“?”,相比之下就不如大陸字形好。又如“絲(絲)”字,大陸簡化后的字形“絲”,是一個連體字元[5],雖然可以也還可以方便地對其分解后應用于鍵盤編碼輸入,但按照這個字形進行的分解不符合“十忽為絲,糸五忽也”[6]這個字理,不利于識字教學;而臺灣現行字形“絲”,就符合這個字理,有利于識字教學,同時也可以方便地分解后應用于鍵盤編碼輸入。從計算機信息處理的角度出發對二者進行比較,“絲”要優于“絲”。
在對異體字的處理上,兩岸四地哪一方規定的“正體”字更附合信息處理的要求,就應以這個字形為“統一標準字形”;如果某一個原已作為“異體字”淘汰的字形比之選為“正體字”的字形更附合信息處理的要求,就應該把二者換位;即把原“異體字形”扶正,把原“正體字形”淘汰[7]。如“糴(糴)”字,大陸把“糴”簡化為“糴”,即取“糴”為規范字;臺灣則取“糴”為正體字,把“糴”定為“糴”的異體字。應該說,“糴”的兩個字元界線分明,讀音明確,整字的字理也很清楚,書寫又方便,比“糴”要好;但如果采用“糴”作為正體會引起編碼沖突[8]的話,那就需要考慮采用“糴”為正體了。因為“糴”有“入、米、羽、隹”4個字元,比只有“入、米”兩個字元的“糴”多了2 個字元,相應編碼元素也就多了2個,發生編碼沖突的可能性要比用“糴”作正體字小。
對于雙方的等同異體字,本文認為也應該按“有利于解決信息時代漢語言記錄符號和記錄工具的矛盾”這一原則重新調整。如“蠹(?)”,目前雙方都把“蠹”作為正體字。筆者則贊同林夫先生用“?”作正體字的主張[9]。對比“?”和“蠹”兩個字形,很顯然,“?”非常容易分解,而且字理清楚,筆畫也少,好記好寫,不僅方便計算機鍵盤輸入編碼,也有利于識字教學和手工書寫[10]。
同一漢語語素的現行字形和歷史字形二者,也應該按上述原則處理。如果歷史字形比之現實字形更附合于信息處理的要求,那就應該取歷史字形為“統一標準字形”。許多專家學者提出的“非對稱簡繁字”[11]和本文作者提出的“連體字元”[12]等就都屬于這種情況。對于大陸來說,“非對稱簡繁字”中的繁體字即是其所對應簡體字的歷史字形。為了實現簡繁之間的正確轉換,就需要恢復這些繁體字的使用,將其歸入“統一標準字形”之列。又例如“曹”字,現在使用的這個字形,上方的“ ”是一個連體字元,是把兩個“東”簡省后又連體而成。這就模糊了字元之間的界線,在計算機鍵盤輸入編碼中不易分解;而其歷史字形之一“ ”,其三個字元相互之間徑渭分明,很容易分解,而且對它的分解不會破壞字理[13]。
需要說明的是:前面所舉的幾個字例,只是為了幫助說明筆者“漢字書同文應以是否有利于漢文字的計算機處理為標準”這一主張,并不是筆者對相關單字調整的最后學術建議。
二
要實現書同文,就不可避免地要對兩岸四地當前使用的部分漢字的字形作不同程度的改變調整。這個改變調整,是在信息時代這一時代環境中進行的,因此,漢字書同文,是包含在信息時代的漢文字優化范疇之內的,必須和漢文字的信息處理統籌考慮。
計算機處理漢字的原理,決定了無論兩岸四地中的哪一方,都不能只是就字形而論字形了。這是因為,對任何一個漢字字形的改動,都將涉及到信息處理用漢字編碼字符集的調整和新老標準的兼容性問題;都將涉及到宋、楷、黑、仿宋、行書……等等各種字體字模庫的調整及兼容性問題;都將涉及到相關計算機中文應用軟件的兼容性問題;甚至還將涉及小學識字課本的改編問題……,等等,等等。這已經不單單只是漢文字學單一學科的研究課題了,而是一個涉及多學科的龐大的系統工程,將牽一發而動全身。
信息時代漢文字優化以及漢字書同文課題的這一重要技術特點,要求我們在討論漢字字形的調整時,必須多學科聯合,多方面論證。只有在取得學術上[14]真正成熟的,技術上真正切實可行的,并得到兩岸四地一致認可的整體方案之后,才能最后通過行政手段在包括計算機漢文字處理領域在內的各個漢字使用領域正式推行之。在這之前,各方對現行漢字體系欲做的一致的調整,或任何一方對現行漢字體系欲作的與其他方不相同的單方面的調整,最好都只限于學術討論范圍之內,以免造成漢文字使用上的新的書不同文現象,造成漢文字使用上的混亂和人力、財力的大量浪費,除非調整后所采用的新字形已在現行計算機字符集中存在。在進行學術討論的同時,可以先在手寫領域中試行。手寫試行期,正好可以作為新老漢字體系的過渡期。但這并不是說,我們可以消極等待;恰恰相反,正是由于漢文字優化課題所面臨的這一新的時代特征,正是由于涉及學科之多,涉及技術之復雜,而決定了研究對象的廣度和深度都將是空前的,這就需要我們以更加高昂的熱情和嚴謹的學風,以更加好學的精神,和時不我待的緊迫感,更加奮發、積極地投身于信息時代的漢文字優化和漢字書同文研究事業之中,在最后實現符合信息處理要求的漢字書同文的時機到來之前,通過廣泛的討論和手寫領域的試驗,作好學術上和社會心理上的充分準備,以便能夠在這一時機到來之時,及時拿出比較成熟的學術建議方案[15]。[1] 本文是筆者為在七研會上宣讀的論文《論信息時代的漢文字改革》加寫的一章。《論信息時代的漢文字改革》全文,可以登錄《語言文字網》(www.yywzw.com/cmr)閱覽。
在《論信息時代的漢文字改革》一文中,筆者主要是論述了以下幾個問題:
一、漢語言記錄符號和記錄工具的矛盾運動,是漢文字形體演變的直接動因,每一種新的記錄工具的普及使用,都必然會促使漢文字形體發生新的演變;
二、信息時代,漢語言記錄符號和漢字信息處理新工具——電子計算機的矛盾是主要矛盾;
三、信息時代漢文字改革的主要任務,不是拉丁化;也不是單純的繼續簡化,而是要原表意文字大框架內對當代通行的漢文字進行適度改革使之適應計算機處理的需要。
上述文章發表三年來,通過與網友的討論,以及與書同文沙龍同仁的交流,對一些問題有了一些新的思考:如原來的文題《論信息時代的漢文字改革》中的“漢文字改革”這一提法,習慣上一般是和漢字的拉丁化聯系在一起的。拙文既然是主張在“表意文字大框架”內對漢字進行調整,就不宜用“改革”這一提法,所以現在改為“漢文字優化”;再有就是,《信息時代的漢文字優化》和漢字書同文到底有什么聯系?這種聯系又有什么具體內容?于是就有了今天要提出來和各位討論并向各位請教的這篇短文。
[10] 《第一批異體字整理表》中沒有這一組字,但《辭海》和《現代漢語詞典》都把“?”作為“蠹”的異體字;1990年重排的《新華字典》也把“?”作為“蠹”的異體字。《漢語大字典》四卷2908頁,“蠹”條:《說文》:“蠹,木中蟲,從 (音k?n,作者注),橐聲。?,蠹或從木,象蟲在木中形。”2877頁“?”條:同“蠹”。并引梁啟超《節省經費問題》:“?日蛀木,木腐而?安棲?”