2007年8月16日上午9:30,教育部举行中国语言生活状况报告(2006)新闻发布会,向新闻界介绍“2006年中国语言生活状况报告”有关情况。 [李宇明]第四,2006年语言文字使用的一些数据。第一方面,汉字使用的情况。我们总结为四个字,叫“稳中有变”。2005年,我们调查了7亿字的语料,2006年我们调查的语料大约9亿字。这两年的统计结果如下:使用频字稳定,比如说2005年覆盖整个语料80%,只用了581个字,覆盖语料90%用了934字。2006年的情况是,覆盖语料80%,用了591个字,多了10个字,覆盖语料90%是958个字。显然2006年用字比2005年用的字在语料覆盖上多了一些。在使用频率最高的前600个字中,只有21个字不同,前1000字中只有34个字不同。这是06年与05年高频字比较的情况。 除了和05年用字比较,我们和以往发布的文字规范进行比较。比如前2500字,同过去的一级常用字比较,差距很大,有331个字不在一级常用汉字中。在3500个高频字与《现代汉语常用字表》比较,有388字不在《现代汉语常用字表》里。前7000字与《现代汉语通用字表》比较,有517字不在《现代汉语通用字表》中。 通过比较现在的用字和过去发布的语言文字用字规范情况说明,我们今天的语言生活已经有了很大的变化,也给我们提出了一个任务,应该对已有的汉字规范进行修订和调整。 汉字使用叫做“稳中有变”,词语的使用叫“变中有稳”。2005年与2006年比较,使用的相同的词种数为586161,分别占2005年、2006年词种数的35%、29%,变化率达到65%以上。但是我们对比了活跃、变动的我,主要是低频词,如机构名、人名、地名,体现出社会语言生活的丰富多彩。今年我们还尝试进行了词性的统计,统计了动词、名词、形容词等等,当然我们的软件在这方面还不能够在9亿字的语料库里自动标记,还有一些问题,这是现在的实际情况。在实用当中名词最多,其次是动词、助词、副词、形容词、介词、代词、数词、量词、连词。专有名词数量最大,在整个语言中占94.86%。这就给我们提出一个重要问题,专有名词是语言性质的重要组成部分,我国的各种术语中,专有名词是一个非常重要的部分。 在词语使用方面我们调出了字母词使用情况,包括含有字母,也包括和汉字现结合的,不包括外文词。进入5000高频词语的有10个字母词,VS、DVD、CEO等,字母词占词语总数的9%,但使用频次低。字母词在我们语言生活中的作用主要是指代和排序。如A区、B楼、C座。列车车次用K、T、Z、1,汽车牌号中的字母,起指代、排序佐饔得字母词,占全部字母词种数的73.……在这次研究当中,我们发现字母词使用存在着很多问题,第一个问题,大量的异形字母词存在,比如说这个词是大写小写不确定,比如说MP3,还有一些……什么GPS定位系统、GPS导航仪等等,比较乱。 另外,同形字母词大量存在,比如“PM”,在我们语料库里发现,它是表示“下午”的意思,也代表“溜须拍马”的汉语拼音的缩写。所以我们认为,字母词的使用需要谨慎、需要规范。 |