主要利用哈希函数与bitmap的数据结构来完成对号入座的抓取策略。如果用原文解释这一过程(对号入座),不免有许多人都会一头雾水,笔者用一个例子来说明这一抓取策略。假设有足够多的格子,并为其编号,顺序为1到N。然后有1到N个编号的小球并且不唯一,随机抽取一个编号35的小球,对应的放到编号35的格子中,这样一次抓取结束。另外所要注意的是,所有第一次抽取的小球都会按照这个规则进行对好入座,假设再一次抽取时,又抽到35号小球,而35号格子已经放有35号小球,那么就确定此次抽取失败,一次类推,循环往复。
实际的抽取中,要比上例复杂很多,不过原理相同。

本文源于漂博远方http://www.ycdsk.com/, 原文地址:http://www.ycdsk.com/post/39.html