逆文档频率(IDF inverse document frequency)又称反文档频率,是文档频率的倒数,主要用于概念TF-IDF(term frequency–inverse document frequency)中。
...ord):基于文档中词项个数的协调因子,一个文档命中了查询中的词项越多,得分越高。 逆文档频率(inverse document frequency):一个基于词项的因子,用来告诉评分公式该词项有多么罕见。逆文档频率越高,词项就越罕见。
基于66个网页-相关网页
现代信息检索第三章信息检索模型_Yode_新浪博客 F:DF反映了Term的区分度,DF越高表示Term越普遍,因此其区分度越低,因此权重也越低。 ②逆文档频率(Inverse DF,IDF):DF的倒数,通常采用如下公式进行计算(N是所有文档的数目): 向量空间模型中通常采用TF*IDF
基于4个网页-相关网页
现代信息检索第三章信息检索模型_Yode_新浪博客 F:DF反映了Term的区分度,DF越高表示Term越普遍,因此其区分度越低,因此权重也越低。 ②逆文档频率(Inverse DF,IDF):DF的倒数,通常采用如下公式进行计算(N是所有文档的数目): 向量空间模型中通常采用TF*IDF
基于2个网页-相关网页
应用推荐