
一个小脚本,定时登录校园网完成签到任务(脚本每天定时运行 3 次就行了,也不算高频),UA 使用 fake_useragent, 还是依旧被识别是非人类操作然后 ip 被 ban 了。在本月护网运动之前脚本一直正常运行好几个月,甚至不加 ua 都没问题。 发 post 请求的时候用的 cookie 是使用 selenium 模拟登陆从浏览器中获取的。很好奇是通过什么特征被检测到的,不知道还有哪些伪装可以做,避免被检测?
更换 ip 应该也没啥用,因为换了台云服务器来跑,跑一下就被 banip 了,所以很迷惑。
1 Gloomyer 2020-10-27 20:34:09 +08:00 selenium 要做一定的伪装 服务器可以拿到一些特征信息 |
2 opengps 2020-10-27 20:43:17 +08:00 via Android 不改 ua 的爬虫,就跟兔子用胡萝卜当诱饵钓鱼似的 |
3 zzzain46 OP 哈哈哈哈不过我感觉也不是通过 UA 来检测的 |
4 hellos 2020-10-27 21:17:55 +08:00 “发 post 请求的时候用的 cookie 是使用 selenium 模拟登陆从浏览器中获取的。” 所以,你是通过 python 或其他语言直接发的包?那这样识别起来太容易了 |
5 Sunben 2020-10-27 21:37:13 +08:00 我猜原因就是你用的是云服务器,每隔一个周期,后台把 i 所有访问者 ip 查一下,哦,原来是阿里云、腾讯云的机子,ban 了。 |
7 fansangg 2020-10-27 22:05:37 +08:00 那就跑之前拉一批免费的代理,然后循环一波 |
8 misaka19000 2020-10-27 22:57:47 +08:00 把签到时间点随机一下,别太固定了 |
9 zzzain46 OP @hellos 对的,主要是考虑到学校里的系统都是外包做的,也没想到会被检测,还是地低估了哈哈哈 |
10 zzzain46 OP |
14 zarte 2020-10-28 10:06:42 +08:00 用自己电脑试,先排除 ip 问题,然后再查 cookie,ua,一般外包的不会太严。 |