湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

发布日期:2005-11-30

 

4数字

 

     赵元任在语言和符号系统Language and Symbolic Systems 一书P216写到:另一方面,由于我们面对复杂的符号组合的情况要比面对简单的符号的情况多,所以小的符号比大的符号有更多的优点;因为它们可以将更多的事物集中地放在一起。这样,进行相同程度的记忆,或者集中精力,人们可以抓住更多的复杂事物之间的联系。当然,人们永远可以定义简单的符号,使之等同于复杂的组合符号。实际上大的系统就是这样建立起来的。没有任何人的脑子能够同时抓住这个大系统的所有细节。但是,简单的符号在可以分辨的范围内有更大的伸缩性。人们可以更有机会洞穿各种联系。而在另一种情况下,由于有太多的组合以及替代品,经常使人们漏掉一些线索,或者说错把符号当作事实。

      符号的尺寸与它所表现的信息的数量是两回事。为了说明这一点 George A. Miller在他的奇怪的数字7,加减2 The Magical Number Seven, plus or Minus Two一文(Psych. Rev. vol. 63, 1956, pp. 8197)中,提出了一种有用的区别方法,单体信息和块体信息。例如,在汽车的牌子上有三个字母和三个数字,我们说它有六个块体信息,但是前三个块体中有263,或17,576种可能性,或者说比14个比特bits(214=16,384)稍微多一点的可能性,但是后面的三个块体仅仅有 10个比特(210 = 1024)的可能性。但是, Miller证明,人脑在记忆 BGAH

BHA2718281时是相似的。Miller认为,根据符号的性质的不同,人们对于块体即时记忆的能力是7±2。对于感官来说同样是块体信息当然可以有不同的结果。由于我用英语作加法的时候非常迅速,我自认我用英语表达数字和汉语表达数字一样的好,但是我的脑子能够同时出现的汉语数字比英语多。原因是汉语数字都是由CV(普通话)结组成,而英语的6CVCC (six) 7CVC(V)C(seven)有更多的块体。我用30秒钟完成汉语的九九表,而用45秒钟完成英语的九九表。赵元任所说的:人们永远可以定义简单的符号,使之等同于复杂的组合符号。似乎没有考虑到虽然我们可以任意定义,但是,不管是简单符号,还是复杂符号都是有数量限制的,如果某一类简单符号已经用尽,那么就不能再用它来定义别的意思了。否则,或者造成混淆,或者将原有的定义挤掉。对于英语的67,我的分音方法也和赵先生不太一样,按照他的说法,似乎7的发音seven6的发音six长,但是,我认为6的发音是[s·k·s],应该比7[s·ven]长。赵元任用非常简洁的语言阐明了声音种类多的语言要比声音种类少的语言,表达更快,更加省力这一现象。而对于怎样选择数字的类型,怎样从连续的意思中截取代表意思的符号则需要另外的一种思考。让我们先来回顾一下过去的数字系统。

      ELLP2839阿拉伯数字没有那种所谓直观的、内在意思,这一点很重要。在表达数字二的时候,罗马人用一种比阿拉伯数字2更为直观的方式创造了Ⅱ,(竖线的个数代表了需要表达的数值)。这样,罗马数字就显得臃肿和不经济。比如,表示八百八十二的时候就要用(MDCCCLXXXII)对于这一点,我的看法与作者有些不同。我认为,真正的原因是因为罗马数字没有利用好位置的信息。由于罗马的书写是横行,所以最初的想法是按照横向将竖线逐渐排列下去以代表数字。这种情况和以竖行为主的汉字,用一、二、三作为数字一样。但是,到了三以后,罗马人和中国人都发现再继续画线就太不经济了;中国有一则笑话是讽刺这种现象的:有一位学生,第一天学写一,第二天学写二,第三天学写三。第三天回家后他对父母讲,所有的数字我都会了。父亲说好,我有一个朋友姓,你明天给他写封信吧。第二天,直到吃午饭的时候,这位学生还没有出房间。父亲过来敲他的房门。里面回答:别打搅我,从早上到现在,我刚写到五千。

     从这个笑话来看,我们应该在最早的阶段就采用符号而不是线段来代表数字。对于罗马人来讲,更重要的是正确地使用位置。罗马数字的五是V,其实也是两竖,仅仅是有一端相交而已。四是五减一IV,而凡是减号后面的数字就放在左边,需要加的数字就放在右边。比如,四是IV而六则是VI。十是X,还是两竖,仅仅是中间相交而已。九是IX,十一则是XI。这样,本以为可以节省符号的,但是到后来就发现,符号必须越来越多,因为到了一百的时候就不能够写十个X而必须有新的符号来表示。同样,到了一千、一万等等;每进十位的时候,都要考虑是否需要新的符号?于是就出现了5V10X50L100C500D

1,000M等。其中,开始的几个符号,如VXL明显地依然带有竖线的痕迹,但是后来就坚持不住了。由于在符号中,位置的信息已经被使用,就不能再用了,所以只好全部用符号来代表数字。比如六十三,罗马数字的六是VI,三是III,如果位置代表十进位的话,将是VIIII,它将与七十二混淆,罗马数字的七是VII,二是II,按照上述排列,七十二也应该是VIIII。罗马人必须用五十L加上十X来代表六十,六十三则写成LXIII另外,从罗马数字的划分来看,他们最初可能使用的是五进位制而不是十进位制。当遇到指数和对数问题的时候,由于罗马字母很难缩小,所以在表达上就更困难了。汉语虽然从来都是十进位制,在表达上比罗马数字稍微强一些,但还是没有利用位置的优势,比如三十三,中必须加一个字而不用三三。相比之下,受希腊、罗马影响的西方国家对于使用什么进位制来说比中国人更加灵活。比如,在买东西的时候,中国人说1,200时可能是一千二百,也可能是一千二,因为贴在千后面的一定是百。而英国人可能说one thousand and two hundred一千二百,也可能说 twelve hundred十二百。中国人可能说三块五代表三元五角,英国人可能说three fifty三、五十。

      阿拉伯数字则在一开始就设置了从零到九,共十个符号,正是由于它们可以互相区分,所以能够利用位置来区别十进位,这样,大大地减少了工作量。工作量的减少使人们在思考问题上也就更容易轻装上阵。

      也许你认为,罗马人和阿拉伯人采用不同的进位制纯属偶然。但是,细想起来,也许有什么必然规律,比如,也许在开始考虑数的时候,阿拉伯人考虑的数字比罗马人更大。即使是当今世界,也有类似的问题出现,就是对于各种数量级的命名问题。目前我们采用的所谓公制,实际上是当年法国人开始使用的。它是根据从北极点到赤道的距离来定义基本单位开始的。以后所有的面积、体积都由它来定义。由于要考虑到体积,所以,每三个零改变一次名称。比如一的后面有三个零称为千thousand,六个零是million,九个零是billion等。而英国曾经抵制这种做法,所以英制直到今天还是乱七八糟。中国过去用四个零改变一次名称比如一后面四个零是,八个零是亿等等。不过,所有的方法都没有利用指数来表达,因此,每增加一定的数量时,我们还要像古罗马人那样设计一个新的名字。下表列出英、美数量级的对比以及我的建议。其中的代表指数的意思,指九代表十的九次方这种做法虽然有时多发了一个音,但它的好处却是为所有的数量级取了学名,连英美体制都望尘莫及。因为它不但可以给出各种单位(1071011等英美没有的单位)而且,不需记忆。如果数一数发音。读者会发现,它们的发音总数少于英语。就汉语来讲,除个,十,百,千,万以外基本上都是两个字来表示,如十万,百万,十亿,百亿等。而目前,在这样的数量级上,人们几乎不用类似一亿七千五百万这样的说法,而是一点七五亿,所以,采用此法后基本上没有增加发音负担。
     
如果把上述的指一,指二等变成一个字也并不困难,因为一,二,三,四,五,六,七,八,九,零等字的发音中只有一,七的韵母相同,如果人为地加上不同的声母后,可使所有这些字的韵母都不相同,再把它们与的声母拼在一起,便得到十个我们所需要的单音字。如的声母是zh,五的韵母是ǔ,所以代表指五的字的发音可以是zhǔ。

      741

 

美国

英国

理想

million

106

106

指六

billion

109

1012

指九

trillion

1012

1018

指一二

quadrillion

1015

1024

指一五

quintillion

1018

1030

指一八

sextillion

1021

1036

指二一

septillion

1024

1042

指二四

octillion

1027

1048

指二七

nonillion

1030

1054

指三零

decillion

1033

1060

指三三

undecillion

1036

1066

指三六

duodecillion

1039

1072

指三九

tredecillion

1042

1078

指四二

quattuordecillion

1045

1084

指四五

quindecillion

1048

1090

指四八

sexdecillion

1051

1096

指五一

septendecillion

1054

10102

指五四

octodecillion

1057

10108

指五七

novemdecillion

1060

10114

指六零

vigintillion

1063

10120

指六三

 centillion

10303

10600

指三零三

      即使这样改变以后,汉语在用声音表达的时候也比英语简洁得多。对于十的负指数,我们应该发明一个字它的发音应该是FI,是汉语拼音的声母,加上的韵母。

      742

现有名

Current name

米数

理想名

 

terametre

1012

指一二米

 

gigametre

109

指九米

千千米

megametre

106

指六米

百千米

hectockilometre

105

指五米

十千米

myriametre

104

指四米

千米

kilometre

103

指三米

百米

hectometre

102

指二米

十米

decametre

101

指一米

metre

100

分米

decimetre

101

FI一米

厘米

centimetre

102

FI二米

毫米

millimetre

103

FI三米

丝米

decimillimetre

104

FI四米

忽米

centimillimetre

105

FI五米

微米

micrometre

106

FI六米

纳米

nanometre

109

FI九米

皮米

picometre

1012

FI十二米

 

femtometre

1015

FI十五米

 

atlometre

1018

FI十八米

      不过这样一来纳米技术就要改为FI九米技术或者FI九技术了。在孙子算经中长度以尺为单位:

      743

106

105

104

103

102

101

101

100

102

      而大数以为单位:

      744

亿

104

108

1012

1016

1020

1024

1028

1032

1036

      汉语中以四为进位的制度可能和中国古代,天圆地方的想法有关,不过,公制的三维空间作为进位的制度对于现代物理的很多计算都十分方便。如果有一天,人类发现,利用四维空间进行物理研究更为方便,那么,可能有机会重新采用中国的制度。

      类似上述情况,在设计一种语言的时候,寻找足够的可以互相区分的元素是十分重要的。因为以后所有的发展都是由最初设计时,基本元素的数量来决定的。或者我们可以说,语言的质量决定于基本元素的数量。罗马数字在基本数字的设计上坚持使用竖线,而不肯增加新的符号,最终导致了它被淘汰的命运。而理智的阿拉伯数字采用了足够的符号,最终轻而易举地表达了所有的数字。从此,我们也许可以得出一条教训,如果拼音文字不是由三十个左右的字母,而是由三到四千个字母组成的,我们就可以将每一个字母赋予意思。这样,它们实际上就成了西方世界寻求多年的义元 semantic primitive。根据中国的经验,所谓的义元,实际上就是最常用的字,中国人对于字的印象,就好像英国人对于字母那样深刻,并且以为是绝对的,天经地义的东西。其实任何符号都是经过群体的同意才产生的,世界上根本没有绝对的义元但是,我们增加使用的频率可以找到相对的义元,就是那些,我们以为是真实的字、字母、或者单词。字典上就尽量采用这些相对的义元来解释各种条目。西方人寻找的自己解释自己的单词其实就是由中国的汉字组成的单词。汉语和英语的差别并不是质量上的差别,仅仅是发音种类在数量上的差别。

      如果将万国语言定理推广一下,我们就能够得到这样的结果:当符号种类横向增加的时候,语言的发展就非常容易。在下表中是英、汉元素的名称对照。其中大部分的元素,本来在中文中是没有的,但是,通过汉语的机制,发展起来却非常容易,而且信息比英语还丰富。

   745

            1Hydrogen  

            2 Helium

            3 Lithium

            4Beryllium

            5Boron

            6Carbon

            7Nitrogen

            8 Oxygen

            9Fluorine  

            10 Neon

            11Sodium

           12Magnesium

           13Aluminium

           14Silicon

           15Phosphorus

           16Sulphur

           17chlorine  

           18Argon

           19Potassium   

           20Calcium 

           21Scandium   

           22Titanium

           23Vanadium

           24Chromium

           25Manganes

           26iron

           27Cobalt

           28Nickel

           29Copper

           30Zinc

           31Gallium

           32Germanium

           33Arsenic

           34Selenium

           35Bromine 

           36Krypton

           37Rubidium

           38Strontium

           39Yttruim

           40Zirconium

           41Niobium

           42Molybdium

           43Technetium

           44Ruthenium

           45Rhodium

           46Palladium

           47silver

           48Cadium

           49Indium

           50tin

           51Stibium

           52Tellurium

           53Iodine

           54Xenon

           55Cesium

           56Barium 

           57Lanthanum

           58Cerium

           59Protactinium

           60Neodymium

           61Promethium

           62Samarium

           63Europium

           64Gadolinium

           65Terbium

           66Dysprosium

           67Holmium

           68Erbium

           69Thulium

           70Ytterbium

           71Lutecium

           72Hafnium

           73Tantalum

           74Wolfram

           75Rhenium

           76Osmium

           77Iridium

           78Platinium

           79Gold

           80Mercury

           81Thallium

           82Lead

           83Bismuth

           84Polonium

           85Astatine

           86Radon

           87Francium

           88Radium 

           89Actinium

           90Thorium

           91praseodymiu 

           92Uranium

           93Neptunium

           94Plutonium

           95Americium

           96Curium

           97Berkelium

           98Califorium

           99Einsteinium

           100fermium

           101Mendelev

           102Nobelium

           103Lawrenciu

 

      由于每一个元素在表达上非常简短,所以,它们的化合物的表达也相对地简短。因此,中国学生很容易将它们背出来,英国学生却不能。我们知道周期表中有原子量、化合价等重要信息,如果能够背下这个表,那么就是说,所有的这些信息也储存到了你的大脑。此外,部首的应用也提高了非常有用的信息,英语中的后缀虽然也反映了部分信息,但是很不准确。不准确的信息是无人敢使用的。

     下面以字头为例,凡是有这个部首的,在常温下都是气体。比较英语,我们就不敢说具有什么后缀的单词是气体:

      746

            1Hydrogen  

            2Helium

            7Nitrogen

            8 Oxygen

            9 Fluorine  

            10 Neon

            36Krypton

            54Xenon

            86Radon

          

 

 

     字为偏旁的字在常温下都是非金属的固体:

      747

            5 Boron

            6 Carbon

            14 Silicon

           15Phosphorus

            16Sulphur

            33Arsenic

            34Selenium

            52Tellurium

            53Iodine

            85Astatine

 

 

 

书名:《语言的本质》 作者:苏诚忠 语言文字网(www.yywzw.com)发布

语言的本质-目录

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有