《走进搜索引擎》读书笔记--爬虫的两种抓取“顺序”
发布:ycdsk | 发布时间: 2010年5月26日1)深度优先策略
例:长子→长孙→长孙的其他兄弟→次子→次子的其他兄弟
祖 先
↓
长子⑴→次子⑷→其他兄弟⑸
↓
长孙⑵→其他兄弟⑶
2)宽度优先策略
例:
论辈分,小辈永远次于长辈
长子→次子→次子→…………
↓
长孙→次孙→次孙→………..
祖 先
↓
长子⑴→次子⑵→其他兄弟⑶
↓
长孙⑷→其他兄弟⑸
→
对于两种抓取顺序,我们不难看出,宽度优先策略比深度优先策略更优越
发布:ycdsk | 分类:读书有感 | 评论:0 | 引用:0 | 浏览:
| TrackBack引用地址
- 相关文章:
《走进搜索引擎》读书笔记--爬虫的工作原理 (2010-5-26 8:41:11)
《走进搜索引擎》读书笔记--Backlinks (2010-5-26 8:40:37)
《走进搜索引擎》读书笔记--种子站点 (2010-5-26 8:39:23)
《走进搜索引擎》读书笔记,网页的特征 (2010-5-26 8:38:15)
《走进搜索引擎》读书笔记,第37页-第38页,四个结论 (2010-5-23 16:7:58)
搜索引擎发展史,从国外到国内 (2010-5-14 8:52:40)
《走进搜索引擎》相见恨晚 (2010-5-13 20:34:35)
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。





