在用户特征信息提取算法中,衡量词条的权重,我们主要考虑词频(tfik)、逆文档频数(IDFi)以及位置因素。为了提高关键词的特征表达能力,我们还可以进一步考虑词长、词的分布性作为权重衡量因素。
基于12个网页-相关网页
逆文档频数
Inverse document frequency
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动