... 各个单词的词频(term frequency,tf)和 在设计主题爬虫时分类器是必不可少的【4]. 含有各词的文本数(document frequency,dr),根据deep Web主题爬虫是在传统的主题爬行框架基础 公式计算各词的权重,最终用特征向量表示文档...
基于4个网页-相关网页
含有各词的文本数
The number of texts containing each word
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动