
1 xsseroot 2016-06-24 11:47:10 +08:00 将商圈的 url 和 name 做个 hash ,写到 redis 中每次判断下不就行了。 |
2 jatesun 2016-06-24 14:27:58 +08:00 via iPhone 可以放到线程安全的 hash 表里 |
3 chendajun 2016-06-24 14:31:15 +08:00 把抓过的 URL md5 一下,写到 redis , mongo 等。每来一个 URL 就与库里比较一下 |
4 hwsdien 2016-06-24 17:49:41 +08:00 把采集过的 url 放进 redis, 每次采集判断一下。 |
6 practicer 2016-06-29 14:23:29 +08:00 尽管让重复的 item 插进数据库,活干完后 SELECT DUMPS 掉 |