...,生成抓取列表(Generate),抓取内容(Fetch),剖析处置内容(Parse),更新Crawl DB库(Update ),转化链接(Invert Links)不断到树立索引(Index)都是采用MapReduce来完成的。
基于28个网页-相关网页
... Invert Links(得到抓取到的页面的外连接数据) Index(索引) Dedup(去重) ...
基于1个网页-相关网页
invert links
反链接
以上为机器翻译结果,长、整句建议使用 人工翻译 。
应用推荐
模块上移
模块下移
不移动