...主题的聚焦爬虫研究 关键词:聚焦爬虫;Heritrix;BKDRHash算法;HTMLParser;搜索引擎 [gap=1025]Key words:focused crawler;Heritrix;BKDRHash algorithm;HTMLParser;search engine ..
基于32个网页-相关网页
-
focused crawler
- 引用次数:33
Initial performance results show that this rule-based Web-crawling approach uses linkage statistics among topics to improve a baseline focused crawler's harvest rate and coverage.
这种基于类间规则的聚焦爬行方法借助baseline聚焦爬虫的架构,应用朴素的贝叶斯分类器并利用主题团间链接的统计关系构造规则找到在一定链接距离内的“未来回报”页面,并通过实验对该算法的性能进行分析、评价,证明其对聚焦爬虫的爬行收获率和覆盖率有很好的改善。
参考来源 - 聚焦爬行中网页爬行算法的改进—《电脑知识与技术》—2008年第35期—龙源期刊网
focusing crawler
- 引用次数:4
So, This article proposes using Focusing Crawler which Faced Vertical Search Engine to solve the above problem.
为此,本文提出用面向垂直搜索的聚焦爬虫技术来解决上述问题。
参考来源 - 面向垂直搜索的聚焦爬虫研究及应用
focused spider
- 引用次数:1
参考来源 - 基于强化学习的垂直搜索引擎网络爬虫的研究与实现
·2,447,543篇论文数据,部分数据来源于NoteExpress