4数字
赵元任在‘语言和符号系统’Language and Symbolic Systems 一书P216写到:“另一方面,由于我们面对复杂的符号组合的情况要比面对简单的符号的情况多,所以小的符号比大的符号有更多的优点;因为它们可以将更多的事物集中地放在一起。这样,进行相同程度的记忆,或者集中精力,人们可以抓住更多的复杂事物之间的联系。当然,人们永远可以定义简单的符号,使之等同于复杂的组合符号。实际上大的系统就是这样建立起来的。没有任何人的脑子能够同时抓住这个大系统的所有细节。但是,简单的符号在可以分辨的范围内有更大的伸缩性。人们可以更有机会洞穿各种联系。而在另一种情况下,由于有太多的组合以及替代品,经常使人们漏掉一些线索,或者说错把符号当作事实。 符号的尺寸与它所表现的信息的数量是两回事。为了说明这一点 George A. Miller在他的‘奇怪的数字7,加减2’ The Magical Number Seven, plus or Minus Two一文(Psych. Rev. vol. 63, 1956, pp. 81-97)中,提出了一种有用的区别方法,单体信息和块体信息。例如,在汽车的牌子上有三个字母和三个数字,我们说它有六个块体信息,但是前三个块体中有263,或17,576种可能性,或者说比14个比特bits(214=16,384)稍微多一点的可能性,但是后面的三个块体仅仅有 10个比特(210 = 1024)的可能性。但是, Miller证明,人脑在记忆 BGAH BHA与2718281时是相似的。Miller认为,根据符号的性质的不同,人们对于块体即时记忆的能力是7±2。对于感官来说同样是块体信息当然可以有不同的结果。由于我用英语作加法的时候非常迅速,我自认我用英语表达数字和汉语表达数字一样的好,但是我的脑子能够同时出现的汉语数字比英语多。原因是汉语数字都是由CV(普通话)结组成,而英语的6CVCC (six) 和7CVC(V)C(seven)有更多的块体。我用30秒钟完成汉语的九九表,而用45秒钟完成英语的九九表。”赵元任所说的:“人们永远可以定义简单的符号,使之等同于复杂的组合符号。”似乎没有考虑到虽然我们可以任意定义,但是,不管是简单符号,还是复杂符号都是有数量限制的,如果某一类简单符号已经用尽,那么就不能再用它来定义别的意思了。否则,或者造成混淆,或者将原有的定义挤掉。对于英语的6和7,我的分音方法也和赵先生不太一样,按照他的说法,似乎7的发音seven比6的发音six长,但是,我认为6的发音是[s·k·s],应该比7[s·ven]长。赵元任用非常简洁的语言阐明了声音种类多的语言要比声音种类少的语言,表达更快,更加省力这一现象。而对于怎样选择数字的类型,怎样从连续的意思中截取代表意思的符号则需要另外的一种思考。让我们先来回顾一下过去的数字系统。 ELLP2839:“阿拉伯数字没有那种所谓直观的、内在意思,这一点很重要。在表达数字二的时候,罗马人用一种比阿拉伯数字2更为直观的方式创造了Ⅱ,(竖线的个数代表了需要表达的数值)。这样,罗马数字就显得臃肿和不经济。比如,表示八百八十二的时候就要用(MDCCCLXXXII)。”对于这一点,我的看法与作者有些不同。我认为,真正的原因是因为罗马数字没有利用好位置的信息。由于罗马的书写是横行,所以最初的想法是按照横向将竖线逐渐排列下去以代表数字。这种情况和以竖行为主的汉字,用一、二、三作为数字一样。但是,到了三以后,罗马人和中国人都发现再继续画线就太不经济了;中国有一则笑话是讽刺这种现象的:有一位学生,第一天学写一,第二天学写二,第三天学写三。第三天回家后他对父母讲,所有的数字我都会了。父亲说好,我有一个朋友姓‘万’,你明天给他写封信吧。第二天,直到吃午饭的时候,这位学生还没有出房间。父亲过来敲他的房门。里面回答:“别打搅我,从早上到现在,我刚写到五千。” 从这个笑话来看,我们应该在最早的阶段就采用符号而不是线段来代表数字。对于罗马人来讲,更重要的是正确地使用位置。罗马数字的五是V,其实也是两竖,仅仅是有一端相交而已。四是五减一IV,而凡是减号后面的数字就放在左边,需要加的数字就放在右边。比如,四是IV而六则是VI。十是X,还是两竖,仅仅是中间相交而已。九是IX,十一则是XI。这样,本以为可以节省符号的,但是到后来就发现,符号必须越来越多,因为到了一百的时候就不能够写十个X而必须有新的符号来表示。同样,到了一千、一万等等;每进十位的时候,都要考虑是否需要新的符号?于是就出现了5=V,10=X,50=L,100=C,500=D, 1,000=M等。其中,开始的几个符号,如V、X和L明显地依然带有竖线的痕迹,但是后来就坚持不住了。由于在符号中,位置的信息已经被使用,就不能再用了,所以只好全部用符号来代表数字。比如六十三,罗马数字的六是VI,三是III,如果位置代表十进位的话,将是VIIII,它将与七十二混淆,罗马数字的七是VII,二是II,按照上述排列,七十二也应该是VIIII。罗马人必须用五十L加上十X来代表六十,六十三则写成LXIII另外,从罗马数字的划分来看,他们最初可能使用的是五进位制而不是十进位制。当遇到指数和对数问题的时候,由于罗马字母很难缩小,所以在表达上就更困难了。汉语虽然从来都是十进位制,在表达上比罗马数字稍微强一些,但还是没有利用位置的优势,比如三十三,中必须加一个‘十’字而不用三三。相比之下,受希腊、罗马影响的西方国家对于使用什么进位制来说比中国人更加灵活。比如,在买东西的时候,中国人说1,200时可能是一千二百,也可能是一千二,因为贴在千后面的一定是百。而英国人可能说one thousand and two hundred一千二百,也可能说 twelve hundred十二百。中国人可能说三块五代表三元五角,英国人可能说three fifty三、五十。 阿拉伯数字则在一开始就设置了从零到九,共十个符号,正是由于它们可以互相区分,所以能够利用位置来区别十进位,这样,大大地减少了工作量。工作量的减少使人们在思考问题上也就更容易轻装上阵。
也许你认为,罗马人和阿拉伯人采用不同的进位制纯属偶然。但是,细想起来,也许有什么必然规律,比如,也许在开始考虑数的时候,阿拉伯人考虑的数字比罗马人更大。即使是当今世界,也有类似的问题出现,就是对于各种数量级的命名问题。目前我们采用的所谓‘公制’,实际上是当年法国人开始使用的。它是根据从北极点到赤道的距离来定义基本单位‘米’开始的。以后所有的面积、体积都由它来定义。由于要考虑到体积,所以,每三个零改变一次名称。比如一的后面有三个零称为千thousand,六个零是million,九个零是billion等。而英国曾经抵制这种做法,所以英制直到今天还是乱七八糟。中国过去用四个零改变一次名称比如一后面四个零是‘万’,八个零是‘亿’等等。不过,所有的方法都没有利用指数来表达,因此,每增加一定的数量时,我们还要像古罗马人那样设计一个新的名字。下表列出英、美数量级的对比以及我的建议。其中的‘指’代表指数的意思,指九代表十的九次方。这种做法虽然有时多发了一个音,但它的好处却是为所有的数量级取了学名,连英美体制都望尘莫及。因为它不但可以给出各种单位(如107,1011等英美没有的单位)而且,不需记忆。如果数一数发音。读者会发现,它们的发音总数少于英语。就汉语来讲,除个,十,百,千,万以外基本上都是两个字来表示,如十万,百万,十亿,百亿等。而目前,在这样的数量级上,人们几乎不用类似“一亿七千五百万”这样的说法,而是“一点七五亿”,所以,采用此法后基本上没有增加发音负担。 如果把上述的“指一,指二等”变成一个字也并不困难,因为一,二,三,四,五,六,七,八,九,零等字的发音中只有一,七的韵母相同,如果人为地加上不同的声母后,可使所有这些字的韵母都不相同,再把它们与“指”的声母拼在一起,便得到十个我们所需要的单音字。如‘指’的声母是zh,五的韵母是ǔ,所以代表‘指五’的字的发音可以是zhǔ。 表7-4-1 | 美国 | 英国 | 理想 | million | 106 | 106 | 指六 | billion | 109 | 1012 | 指九 | trillion |
1012 | 1018 | 指一二 | quadrillion | 1015 | 1024 | 指一五 | quintillion | 1018 | 1030 | 指一八 | sextillion | 1021 | 1036 | 指二一 |
septillion | 1024 | 1042 | 指二四 | octillion | 1027 | 1048 | 指二七 | nonillion | 1030 | 1054 | 指三零 | decillion | 1033 | 1060 |
指三三 | undecillion | 1036 | 1066 | 指三六 | duodecillion | 1039 | 1072 | 指三九 | tredecillion | 1042 | 1078 | 指四二 | quattuordecillion | 1045 |
1084 | 指四五 | quindecillion | 1048 | 1090 | 指四八 | sexdecillion | 1051 | 1096 | 指五一 | septendecillion | 1054 | 10102 | 指五四 | octodecillion |
1057 | 10108 | 指五七 | novemdecillion | 1060 | 10114 | 指六零 | vigintillion | 1063 | 10120 | 指六三 | centillion | 10303 | 10600 | 指三零三 |
即使这样改变以后,汉语在用声音表达的时候也比英语简洁得多。对于十的负指数,我们应该发明一个字它的发音应该是FI,是汉语拼音‘负’的声母,加上‘指’的韵母。 表7-4-2 现有名 | Current name | 米数 | 理想名 | | terametre | 1012 | 指一二米 | | gigametre | 109 | 指九米 | 千千米 |
megametre | 106 | 指六米 | 百千米 | hectockilometre | 105 | 指五米 | 十千米 | myriametre | 104 | 指四米 | 千米 | kilometre | 103 | 指三米 | 百米 | hectometre | 102 | 指二米 | 十米 | decametre | 101 | 指一米 | 米 | metre | 100 | 米 | 分米 | decimetre | 10-1 | FI一米 | 厘米 | centimetre | 10-2 | FI二米 | 毫米 | millimetre | 10-3 | FI三米 | 丝米 | decimillimetre | 10-4 | FI四米 | 忽米 |
centimillimetre | 10-5 | FI五米 | 微米 | micrometre | 10-6 | FI六米 | 纳米 | nanometre | 10-9 | FI九米 | 皮米 | picometre | 10-12 | FI十二米 | | femtometre | 10-15 | FI十五米 | | atlometre | 10-18 | FI十八米 |
不过这样一来‘纳米技术’就要改为‘FI九米技术’或者‘FI九技术’了。在‘孙子算经’中长度以尺为单位: 表7-4-3 忽 | 丝 | 毫 | 厘 | 分 | 寸 | 尺 | 丈 | 引 | 10-6 |
10-5 | 10-4 | 10-3 | 10-2 | 10-1 | 101 | 100 | 102 |
而大数以‘万’为单位: 表7-4-4 万 | 亿 | 兆 | 京 | 陔 | 秭 | 壤 | 沟 | 涧 | 104 | 108 | 1012 | 1016 | 1020 | 1024 | 1028 | 1032 | 1036 |
汉语中以四为进位的制度可能和中国古代,‘天圆地方’的想法有关,不过,公制的三维空间作为进位的制度对于现代物理的很多计算都十分方便。如果有一天,人类发现,利用四维空间进行物理研究更为方便,那么,可能有机会重新采用中国的制度。 类似上述情况,在设计一种语言的时候,寻找足够的可以互相区分的元素是十分重要的。因为以后所有的发展都是由最初设计时,基本元素的数量来决定的。或者我们可以说,语言的质量决定于基本元素的数量。罗马数字在基本数字的设计上坚持使用竖线,而不肯增加新的符号,最终导致了它被淘汰的命运。而理智的阿拉伯数字采用了足够的符号,最终轻而易举地表达了所有的数字。从此,我们也许可以得出一条教训,如果拼音文字不是由三十个左右的字母,而是由三到四千个字母组成的,我们就可以将每一个‘字母’赋予意思。这样,它们实际上就成了西方世界寻求多年的‘义元’ semantic primitive。根据中国的经验,所谓的义元,实际上就是最常用的字,中国人对于字的印象,就好像英国人对于字母那样深刻,并且以为是绝对的,天经地义的东西。其实任何符号都是经过群体的同意才产生的,世界上根本没有绝对的‘义元’但是,我们增加使用的频率可以找到相对的‘义元’,就是那些,我们以为是真实的字、字母、或者单词。字典上就尽量采用这些相对的义元来解释各种条目。西方人寻找的‘自己解释自己的单词’其实就是由中国的汉字组成的单词。汉语和英语的差别并不是质量上的差别,仅仅是发音种类在数量上的差别。 如果将‘万国语言定理’推广一下,我们就能够得到这样的结果:当符号种类横向增加的时候,语言的发展就非常容易。在下表中是英、汉元素的名称对照。其中大部分的元素,本来在中文中是没有的,但是,通过汉语的机制,发展起来却非常容易,而且信息比英语还丰富。 表7-4-5 1Hydrogen 氢 | 2 Helium 氦 | 3 Lithium 锂 | 4Beryllium铍 | 5Boron 硼 | 6Carbon 碳 | 7Nitrogen 氮 | 8 Oxygen 氧 | 9Fluorine 氟 | 10 Neon 氖 | 11Sodium 钠 | 12Magnesium 镁 | 13Aluminium 铝 | 14Silicon 硅 | 15Phosphorus 磷 | 16Sulphur 硫 | 17chlorine 氯 | 18Argon 氩 | 19Potassium 钾 | 20Calcium 钙 | 21Scandium 钪 | 22Titanium 钛 | 23Vanadium 钒 | 24Chromium 铬 | 25Manganes 锰 | 26iron 铁 | 27Cobalt 钴 | 28Nickel 镍 | 29Copper 铜 |
30Zinc 锌 | 31Gallium 镓 | 32Germanium 锗 | 33Arsenic 砷 | 34Selenium硒 | 35Bromine溴 | 36Krypton 氪 | 37Rubidium 铷 | 38Strontium 锶 | 39Yttruim 钇 | 40Zirconium 锆 | 41Niobium 铌 | 42Molybdium 钼 |
43Technetium 锝 | 44Ruthenium 钌 | 45Rhodium 铑 | 46Palladium 钯 | 47silver 银 | 48Cadium 镉 | 49Indium 铟 | 50tin 锡 | 51Stibium 锑 | 52Tellurium 碲 | 53Iodine 碘 | 54Xenon 氙 | 55Cesium 铯 | 56Barium钡 | 57Lanthanum 镧 | 58Cerium 铈 | 59Protactinium镨 | 60Neodymium 钕 | 61Promethium 钷 | 62Samarium钐 | 63Europium铕 | 64Gadolinium钆 | 65Terbium铽 | 66Dysprosium镝 | 67Holmium钬 | 68Erbium铒 |
69Thulium铥 | 70Ytterbium镱 | 71Lutecium镥 | 72Hafnium铪 | 73Tantalum 钽 | 74Wolfram 钨 | 75Rhenium 铼 | 76Osmium 锇 | 77Iridium铱 | 78Platinium 铂 | 79Gold 金 | 80Mercury汞 | 81Thallium 铊 |
82Lead 铅 | 83Bismuth 铋 | 84Polonium 钋 | 85Astatine砹 | 86Radon 氡 | 87Francium钫 | 88Radium 镭 | 89Actinium 锕 | 90Thorium钍 | 91praseodymiu镤 | 92Uranium铀 | 93Neptunium镎 | 94Plutonium钚 | 95Americium镅 | 96Curium锔 | 97Berkelium锫 | 98Califorium锎 | 99Einsteinium锿 | 100fermium镄 |
101Mendelev钔 | 102Nobelium锘 | 103Lawrenciu铹 | |
由于每一个元素在表达上非常简短,所以,它们的化合物的表达也相对地简短。因此,中国学生很容易将它们背出来,英国学生却不能。我们知道周期表中有原子量、化合价等重要信息,如果能够背下这个表,那么就是说,所有的这些信息也储存到了你的大脑。此外,部首的应用也提高了非常有用的信息,英语中的后缀虽然也反映了部分信息,但是很不准确。不准确的信息是无人敢使用的。 下面以‘气’字头为例,凡是有这个部首的,在常温下都是气体。比较英语,我们就不敢说具有什么后缀的单词是气体: 表7-4-6 1Hydrogen 氢 | 2Helium 氦 | 7Nitrogen 氮 | 8 Oxygen 氧 | 9 Fluorine 氟 | 10 Neon 氖 | 36Krypton 氪 | 54Xenon 氙 | 86Radon 氡 | | | |
以‘石’字为偏旁的字在常温下都是非金属的固体: 表7-4-7 5
Boron 硼 | 6 Carbon 碳 | 14 Silicon 硅 | 15Phosphorus 磷 | 16Sulphur 硫 | 33Arsenic 砷 | 34Selenium硒 | 52Tellurium 碲 | 53Iodine 碘 | 85Astatine砹 | | |
书名:《语言的本质》 作者:苏诚忠 语言文字网(www.yywzw.com)发布 |