
因个人兴趣需要,经常要采集一些数据做分析,为了提高采集效率经常要用到代理。国内的 IP 代理池可用性不高,要自己请求 IP,处理重试,如果碰到需要 JS 渲染才能采集的数据,还得自己上 Headless 浏览器,不是很方便。
国外 scrapingbee 和 scraperAPI 这种服务挺好,但是费用太高,访问国内网站速度也不快。于是干脆就自己参考 scrapingbee 搭建了智能代理服务:五号代理
基本上可以直接绕过绝大部分的反爬策略。当然价格也比国外的服务便宜,注册就有免费额度,欢迎大家试用。
有问题和意见可以直接或提工单反馈给我。再次感谢。
1 est Aug 30, 2021 感谢。已经把免费额度里的 ip 全部拉黑了。 |
2 dapang1221 Aug 30, 2021 看了下文档,不能自定义 header…… |
3 getcodex Aug 30, 2021 这些 ip 是自己的还是爬的 |
4 jasli2 OP @dapang1221 header 直接透传的,直接设置就行。 |
6 xiongbiao Aug 31, 2021 不错,收藏了 |
7 Echoldman Sep 1, 2021 赞 |
8 adrianzhang Sep 2, 2021 @est 哈哈哈笑死我了 |
9 ragnaroks Sep 4, 2021 都是数据中心的 ip,那不是一死就死一大片?我觉得还是和卫士管家那些找量比较靠谱 |
10 iqoo Sep 7, 2021 支持 JS 渲染?哪天来一个 1Day 就能把服务器黑了。 |