齐普夫定律是美国学者G.K.齐普夫于20世纪40年代提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示等级序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。
这可以从齐普夫定律(Zipf’s Law)中得到解释。1935年,语言学家乔治·齐普夫(George Zipf)指出,使用最多的英语单词“the”占到了人们所有会话量的7%,排名第...
基于26个网页-相关网页
1 齐普夫定律(Zapf law) 1.1 齐普夫定律的文字表述 如果把一篇较长的文章中每个词出现的词频统计起来,按照高词频在 前、低词频在后的递减顺序排列,并用...
基于8个网页-相关网页
到的齐普夫定律 George Kingsley Zipf's law
Zipf Law have revealed relationship between word frequency and word serial number in the west language firstly, it has very broad application value.
齐普夫定律首次揭示了西方语系中词频和词序号关系,有很广的应用价值。
参考来源 - 中文文本分类技术的研究·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐