|
本帖最后由 kyletruman 于 2016-6-25 22:20 编辑
在《现代汉语常用词表》中使用频率越高的词排序越靠前,使用频率越低的词排序越靠后,这种降序排列让人一目了然。李行健说,研制过程中采取了课题组独创的“词频频级排序法”。由于词语的来源比较广泛、各自不同,各种语料都有自己的覆盖面和构成特点,词表中的词语不能在每种语料中都得到全面显现。比如,同一个词,在三种语料库中的词频就会不同,有的还差别很大。为了科学反映每个词较真实的词频,采用了频级的统计方法,即将每个词语的三种语料的频级之和除以三的办法。这样就能较好反映出一个词现实生活中的综合的常用度,在此基础上,再由专家进行人工审核筛选,“也就是说,这些常用词的出笼是客观和有科学依据的。”
《现代汉语常用词表(草案)》提出了现当代社会生活中比较稳定的、使用频率较高的汉语普通话常用词语56008个,形成《现代汉语常用词表(草案)》,给出了词语的词形。《现代汉语常用词表(草案)》的词语收录,既注意词语的系统性,又注意词语在语用中的实用性。
商务印书馆出版的《现代汉语常用词表》(草案)披露:当今社会,经常使用的词共有56008个。这56008个常用词中,包括单音节词3181个,双音节词40351个,三音节词语6459个,四音节词语5855个,五音节和五音节以上词语162个。
以我的理解,数字越小,使用频率越高。 |
|