字频就是字的使用频率。
每个汉字的使用频率是不平衡的,有的使用频率高,有的使用频率低。使用频率高的称为高频字,使用频率低的称为低频字。从发展上看,高频字和低频字之间没有绝对界限,在一定条件下它们往往会互相转化。
新中国成立以来,有成果的字频统计进行了好几次。1965年发布的《印刷通用汉字字形表》收入的6196个字,是根据全国几家大型印刷厂所用的汉字铸字量的多少选择的,入选的字都是使用率较高的字。1977年,我国又进行了一次大规模的现代汉语用字情况调查,统计了1975年至1976年两年内的2162万字的中文资料,得出不同单字6360个,编成《汉字频度表》。在此基础上,1981年由国家标准局公布了GB2312—80《信息交换用汉字编码字符集·基本集》,该集共收6763个不同单字。1985年又利用电子计算机进行了一次历史上规模最大、时间跨度最长(1919年至1982年)、统计科别最多的字频统计工作,拟订出《现代汉语用字频度表》。从1986年开始,为拟订《现代汉语常用字表》和《现代汉语通用字表》又进行了新的字频统计。这次统计选材的范围是从1928年至1986年,在此时间区域内采用不等密度抽样,即按时间顺序,抽样量逐渐增加,以近期的资料为主要抽样对象。这两个表于1988年先后发布。
统计汉字使用频率是从汉字的应用量上去考察汉字,这有很重要的意义和实用价值,不仅为汉字的定量研究提供有用的数据,而且对于语文教学、汉字机械处理和信息处理的研究也有重要的参考价值。
1986年出版的《最常用的汉字是哪些》一书中列出使用频度最高的1000字,现将前100字按使用频度高低排列如下:
的de、一、是、在、不、了le、有、和、人、这、中、大、为wèi、上、个、国、我、以、要、他、时、来、用、们、生、到、作、地dì、于、出、就、分fēn、对、成、会、可、主、发、年、动、同、工、也、能、下、过、子、说、产、种zhǒng、面、而、方、后、多、定、行xíng、学、法、所、民、得de、经、十、三、之、进、着zhe、等、部、度、家、电、力、里、如、水、化、高、自、二、里、起、小、物、现、实、加、量、都、两、体、制、机、当、使、点、从、业、本