... ( 3) 其中:有 tf i, j 为词条频度 ( term frequency) ,指单词 i在文档 j中 出现的次数; df i 为文档频度 ( document frequency) ,是出现单词 i的文档数。
基于40个网页-相关网页
中的文档频度 document frequency
In this paper, universal dimension reduction methods were studied for SVMs, including information gain, document frequency, X2 test and latent semantic indexing.
本文考察了信息增益、文档频度、X2统计和潜在语义索引几种特征降维方法,同时在中英文数据集上进行了比较实验。
参考来源 - 面向支持向量机的降维方法比较分析·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐