出处:按学科分类—语言、文字 江西教育出版社《中国语言学大辞典》第657页(260字)
在按频率递减顺序排列的频率词典中,词的序号和词的频率之间存在着一定的数量关系。可以公式化为:。其中r为词的序号;k和γ都是常数;Pr则是序号为r的词的频率。美国语文学家齐夫(G.K.Zipf)通过实验测出γ=1,K=0.1。例如,如果词的序号为50,那么,根据公式得出:0.002。该公式称为齐夫定律。由齐夫定律可知,如果频率词典包含数十万个词,那么,其中头一千个最常用的词占该语言各种文章中全部出现的词百分之八十,因为