基于无词典分词的中文生物医学文献相关性数据库构建方法研究 - docin.com豆丁网 准化处理(见公式 2.1);广域权值取文献总数与特征项文献频率比值的对数(见公式2.2)。整体权重 赋值方案可以理解为一种改进的逆文献频率(InverseDocument Frequency,IDF) 加权法。最终用于计算两篇文献间相似度的夹角余弦公式见公式2.3。 twit=0.5+0.5×—m—
基于4个网页-相关网页
整体权重 赋值方案可以理解为一种改进的逆文献频率(InverseDocument Frequency,IDF) 加权法。最终用于计算两篇文献间相似度的夹角余弦公式见公式2.3。
基于1个网页-相关网页
应用推荐