1) 统一重访策略:爬虫以同样的频率重访已经抓取的全部网页,已获得统一的更新机会,所有的网页不加区别的按照同样的频率被爬虫重访。
2) 个体重访策略:不同网页的改变频率不同,爬虫根据其更新频率来决定重访该个体页面的频率。

虽然笔者未证实百度、谷歌等著名搜索引擎的重访策略,不过笔者通过不同网站的web日志可以判断,这些搜索引擎应该结合运用了统一和个体两种重访策略。

本文源于漂博远方http://www.ycdsk.com/, 原文地址:http://www.ycdsk.com/post/43.html