一 历史
甲骨文汉字是世界上最古老的三大文字系统之一。其中,古埃及的圣书字、两河流域苏美尔人的楔形文字已经失传,仅有中国的汉字沿用至今。
传说中,汉字起源于仓颉造字。黄帝的史官仓颉根据日月形状、鸟兽足印创造了汉字,造字时天地震惊——“而天雨粟,鬼夜哭”。从历史角度来看,复杂的汉字系统不可能由一个人发明,仓颉更可能在汉字的搜集、整理、统一上做出了突出贡献,所以《荀子·解蔽》中记载“好书者众矣,而仓颉独传者,一也”。
有观点认为《周易》中的八卦对汉字形成有较大影响,但支持者甚少。
二 原始文字
文字发明前的口头知识在传播和积累中有明显缺点,原始人类使用了结绳、刻契、图画的方法辅助记事,后来用特征图形来简化、取代图画。当图形符号简化到一定程度,并形成与语言的特定对应时,原始文字形成。
1994年,湖北杨家湾大溪文化遗址出土了大量陶器,其上170多种符号中,部分特征与甲骨文有较大类似之处。这一发现将原始汉字的形成过程推定到距今6000年以前。此外,山东大汶口出土的陶器上的象形符号,西安半坡彩陶上的几何符号等,都可能是原始文字形成中(或形成前)不同阶段的表现。
但是,商朝以后的汉字和这些几何符号是否一脉相承?这个问题还在争议中。许多学者提出,这些符号不一定是汉字的前身,甚至不能绝对肯定是文字符号。
三 从象形到表意
泰山封山刻石,相传为李斯所书从甲骨文到小篆,汉字经历了从象形文字到表意文字的发展过程,字形逐步脱离事物的具体形象。这一时期的汉字称为古文字。
商周时期的甲骨文已经是一种比较完整的文字体系。在已发现的4500多甲骨文单字中,目前已能认出近2000字。与甲骨文同期,青铜器上铸造的文字称为金文或钟鼎文,西周时期的《散氏盘》、《毛公鼎》具备很高的史料和艺术价值。
秦始皇统一中国后,李斯在大篆和六国古文的基础上,进行规范和整理,制定出了小篆作为秦朝的标准书写字体,统一了中国的文字。小篆呈长方形,笔画圆润流畅。
小篆解决了各国文字间出现大量异体字的情况,“书同文”的历史从此开始。文字的统一有力促进了民族间文化传播,对中华民族的认同和中国的统一发挥了重要作用,为世界文字史所罕见。
汉字的发展经历了许多不同的演变。初期汉字系统的字数不足,大量事物以通假字表示,使文字表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。但事物众多,不可能都用单一汉字表示,且汉字数量的过度增加又引发了汉字本身的学习困难,汉语逐步从单字表意演变为词语表意为主导。
四 造字及组成
在秦始皇统一汉字后,汉字的数量也在不断地增加,很多新造的字不断出现:
隋文帝杨坚原为随国公,但因“随”字的“辶”有不稳定之意,故去掉“辶”,而造“隋”字作为国号。
唐朝时,武则天根据“日月当空”之意而造字“曌”(同“照”字)作为她的名字。
五代刘岩取“飞龙在天”之意创了自己名字内的“龑”字。
在近代,由於大量西方知识的涌入,也造了许多字。例如随着“Beer”传入中国,如何用汉字表达是一个问题,最初译为皮酒,后觉不妥,於1910年左右创造了“啤”字——译为“啤酒”。为了表示英制的单位,还造了一些多音节的字,如浬(海里)、嗧(加仑)、瓩(千瓦)、呎(英尺)等。不过这些多音节的字在1977年7月20日大陆中国文字改革委员会和国家标准计量局发出《关于部分计量单位名称统一用字的通知》中被淘汰,在大陆地区已不再使用,但台湾等地仍可见到。
目前由於信息化及用字的规范,汉字已经不再任意增加新字。唯一的例外是元素周期表中的各种元素,如“氦”、“氯”、“氡”、“锗”、“铬”、“铀”等。这种造字方法还在一直沿用,用于新元素的命名。化学元素的造字规律详见元素。
六书是汉字构成的分析,在周礼中就提到了六书,但是没有说明具体内容。东汉许慎在《说文解字》中详细阐述了“六书”的汉字构造规律:象形、指事、会意、形声、转注、假借。其中,象形、指事、会意、形声四项为造字原理,是“造字法”;而转注、假借则为用字规律,是“用字法”。惟要注意的是,“六书”是对汉字产生的整理及分类,并不是造字的法则。
五 现代汉字形成
小篆笔画以曲线为主,后来逐步变得直线特征较多、更容易书写。到汉代,隶书取代小篆成为主要书体。隶书的出现,奠定了现代汉字字形结构的基础,成为古今文字的分水岭。
汉代以后,汉字的书写方式逐步从木简和竹简,发展到到在帛、纸上的毛笔书写。草书、楷书、行书等字体迅速出现,不仅满足了公文和日常需要,还形成了浓郁东方特色的书法艺术。古代印刷术发明后,出现了用于印刷的新字形宋体,在现代又陆续出现了黑体、仿宋等字形。
六 汉字的语文知识
“永”字八法[编辑]
字形
汉字是一种方块字,每个字占据同样的空间。汉字包括独体字和合体字,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如“笔”、“尘”;左右结构,如“搞”、“刘”;半包围结构,如“同”、“趋”;全包围结构,如“团”;复合结构,如“赢”、“斑”等。汉字的基础部件包括独体字、偏旁部首和其他不成字部件。
汉字的最小构成单位是笔画。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。
七 读音
汉字是多种方言的共同书写体系,每个字代表一个音节。中国现今以普通话作为标准读音,普通话的音节由一个声母、一个韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而存在明显的同音字现象;同时还存在同一个汉字具有多种发音的情形,称为多音字。这一情况在不同方言中有一定差别,但在汉语中是普遍存在的。
汉字虽然以表意为主,但并非不存在表音成分,最常见的是人名、地名,其次就是外来词的音译,比如沙发。此外,还有部分原有的表音词,如“救火”、(一命)“呜呼”。但即使如此,还是有一定表意成分,特别是国内的人名、地名。而即使是国外的人名、地名,也存在某些表意的低限,比如“Bush”绝不能音译成“不死”。
由于汉字自汉朝到20世纪似乎没有经过多少变化,汉字没有直接表现汉语发音的变化。必须进行专门的研究才能推测它们在上古汉语和中古汉语的发音。
有学者认为,汉朝之前,一个汉字可以代表两个音节,次要音节和主要音节。详见上古汉语。
汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法。
在朝鲜语中则大致为一字一音,没有训读。
受日本影响,其他汉字使用国后来也使用了一些多音节的字,如浬(海里)、嗧(加仑)、瓩(千瓦)等。但是在大陆地区由于官方废除已基本不使用,台湾偶尔还在使用,一般人也明暸其意思。
八 注音
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如“埻,射臬也,读若准”。 直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过於冷僻,这就难以起到注音的作用,例如“袜音韈”等。
魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。
近代以来,又发展出了汉字形式的注音符号(俗称ㄅㄆㄇㄈ)以及很多拉丁字母注音方法。注音符号仍是台湾教学的一部分,而目前中国最为广泛使用的是汉语拼音。
由於汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至於产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但今日北京话前者读“pang”,後者为“long”。如何解释这样的差异,就是音韵学所探讨的课题。