
有人做过模拟淘宝登录吗?最近想模拟登录淘宝联盟, 抓取订单信息,但是一直卡在登录这块。
我用 selenium + chromedriver 模拟登录操作, 但是每次都会显示验证码滑块, 模拟滑块滑过去的操作,就一直提示错误,要我刷新。一直卡在这个步骤。即便我用鼠标自己去操作滑块,也仍然会提示我出现错误,要我刷新。
但是如果我用浏览器正常打开,是不会有滑块出现的。
我觉得是 selenium + chromedriver 一开始进入网页就被识别成爬虫了。
有没有大佬有解决方案
1 murmur 2018-09-12 09:43:00 +08:00 这个知乎上有讨论 从爆栈网上其他人的答案来看 淘宝的却会检查自动化防范 比如识别$cdc_asdjflasutopfhvcZLmcfl_、webdriver 这些关键字 参考 https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver 这个 cdc 我以为是个乱码 看上去就是这么检测的 |
2 bmos 2018-09-12 09:46:53 +08:00 上次看到一个帖子,网站也是用了 webdriver 关键字屏蔽,好像需要自己修改后再编译才能去除。 |
3 golmic 2018-09-12 09:48:59 +08:00 提供基于 http/s 请求的淘宝、天猫、支付宝登录方案,requests 实现,可用于生产环境 |
4 kimqcn 2018-09-12 09:51:48 +08:00 笨,登陆的时候用 Autoit 啊,进去了再用 selenium. |
5 xyfan 2018-09-12 09:52:36 +08:00 别说模拟登陆,我正常登陆都登陆不上去,过不去滑块验证,不知道怎么就把我识别为机器人了。 |
10 dcatfly 2018-09-12 12:47:51 +08:00 改一下浏览器头?不太确定这个原理。另外推荐 Puppeteer。 |
11 beforeuwait 2018-09-12 13:40:41 +08:00 4 楼靠谱 slenium 一进去就被识别为爬虫了,过不了的。 |
12 shapl 2018-09-12 14:16:17 +08:00 直接调订单接口就是了。。。百度搜一下 taobao.tbk.sc.order.get |
14 nilrust 2018-09-12 14:40:31 +08:00 反正最简单的浏览器油猴脚本完全可以解决需求。 |
17 sujin190 2018-09-12 15:20:40 +08:00 而且以前似乎登录一次,你只要一直刷新,接近于使用,几乎不会掉出去,但是现在似乎有事没事踢出去,过几分钟就得重新登录一次,烦人的很 |
18 realkenshinji 2018-09-12 15:30:54 +08:00 除了这个,我记得以前还要你从下面的图片里选出你曾经购买过的物品.... |
19 jccg90 2018-09-12 15:31:11 +08:00 之前做过,登录部分要手动过验证,自动化总是出问题。。。然后加个微信告警通知,需要登录的时候提醒我连上去登录一下。。。 |
20 caibou OP @sujin190 @realkenshinji @jccg90 我目前在淘宝联盟的订单抓取, 但是 50 分钟登录状态就过期了。 不知道有没有什么好方法。 手动扫码登录肯定是不行的, 不可能人工 24 小时都在扫 |
22 Luxurious 2018-09-12 17:00:55 +08:00 现在登录必须得选择已经购买的商品才行吧 |
23 JasperYanky 2018-09-12 17:05:17 +08:00 1.挂阿里旺旺获取 ie 里面的插件拿 cookie 2.调用订单接口,目前工具商已经有部分不完美的接口放出 3.把我加入特别关注 |
24 SpiderXiantang 2018-09-12 18:15:01 +08:00 我登上去过 selenium 用的微博账号 |
25 SpiderXiantang 2018-09-12 18:15:43 +08:00 会跳滑块 但是能登陆 是个淘宝的小问题吧 |
27 caibou OP @JasperYanky 你指的是 window 版的阿里旺旺吗 |
28 JasperYanky 2018-09-13 10:39:36 +08:00 @caibou 是的,阿里旺旺会往 ie 里面插快捷登录 |
29 fantasyni 2018-10-27 17:23:37 +08:00 xposed 去 hook 淘宝自动扫码 怎么弄的? |
30 yu100 2019-01-13 13:25:47 +08:00 @shapl 请问这个有什么特别的地方吗?百度了一圈,又在 top.api 的基础包里查看了,没发现这个权限啊。还请兄弟不吝赐教啊 |
34 wjx1993 2019-02-15 13:40:44 +08:00 "挂阿里旺旺获取 ie 里面的插件拿 cookie"这句是什么意思?在 IE 上登录阿里旺旺,什么插件?@caibou |