阅读文章

新中国成立以来进行过哪些有成果的字频统计?

[日期:2013-01-28] 来源:网络  作者:佚名 [字体: ]
  字频就是字的使用频率。
  每个汉字的使用频率是不平衡的,有的使用频率高,有的使用频率低。使用频率高的称为高频字,使用频率低的称为低频字。从发展上看,高频字和低频字之间没有绝对界限,在一定条件下它们往往会互相转化。
  新中国成立以来,有成果的字频统计进行了好几次。1965年发布的《印刷通用汉字字形表》收入的6196个字,是根据全国几家大型印刷厂所用的汉字铸字量的多少选择的,入选的字都是使用率较高的字。1977年,我国又进行了一次大规模的现代汉语用字情况调查,统计了1975年至1976年两年内的2162万字的中文资料,得出不同单字6360个,编成《汉字频度表》。在此基础上,1981年由国家标准局公布了GB2312—80《信息交换用汉字编码字符集·基本集》,该集共收6763个不同单字。1985年又利用电子计算机进行了一次历史上规模最大、时间跨度最长(1919年至1982年)、统计科别最多的字频统计工作,拟订出《现代汉语用字频度表》。从1986年开始,为拟订《现代汉语常用字表》和《现代汉语通用字表》又进行了新的字频统计。这次统计选材的范围是从1928年至1986年,在此时间区域内采用不等密度抽样,即按时间顺序,抽样量逐渐增加,以近期的资料为主要抽样对象。这两个表于1988年先后发布。
  统计汉字使用频率是从汉字的应用量上去考察汉字,这有很重要的意义和实用价值,不仅为汉字的定量研究提供有用的数据,而且对于语文教学、汉字机械处理和信息处理的研究也有重要的参考价值。
  1986年出版的《最常用的汉字是哪些》一书中列出使用频度最高的1000字,现将前100字按使用频度高低排列如下:
的de、一、是、在、不、了le、有、和、人、这、中、大、为wèi、上、个、国、我、以、要、他、时、来、用、们、生、到、作、地dì、于、出、就、分fēn、对、成、会、可、主、发、年、动、同、工、也、能、下、过、子、说、产、种zhǒng、面、而、方、后、多、定、行xíng、学、法、所、民、得de、经、十、三、之、进、着zhe、等、部、度、家、电、力、里、如、水、化、高、自、二、里、起、小、物、现、实、加、量、都、两、体、制、机、当、使、点、从、业、本




阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:怎样计算笔画数?“凸、长、巨“三字各有几笔?

下一篇:为什么要重视《现代汉语常用字表》的学习?
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章