有人做过模拟淘宝登录吗? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
caibou
V2EX    Python

有人做过模拟淘宝登录吗?

  •  
  •   caibou 2018-09-12 09:31:48 +08:00 11587 次点击
    这是一个创建于 2662 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有人做过模拟淘宝登录吗?最近想模拟登录淘宝联盟, 抓取订单信息,但是一直卡在登录这块。

    我用 selenium + chromedriver 模拟登录操作, 但是每次都会显示验证码滑块, 模拟滑块滑过去的操作,就一直提示错误,要我刷新。一直卡在这个步骤。即便我用鼠标自己去操作滑块,也仍然会提示我出现错误,要我刷新。

    但是如果我用浏览器正常打开,是不会有滑块出现的。

    我觉得是 selenium + chromedriver 一开始进入网页就被识别成爬虫了。

    有没有大佬有解决方案

    第 1 条附言    2018-10-19 14:09:30 +08:00
    解决了。 思路是手机请求二维码下来, 然后 xposed 去 hook 淘宝自动扫码
    34 条回复    2019-02-15 13:40:44 +08:00
    murmur
        1
    murmur  
       2018-09-12 09:43:00 +08:00   2
    这个知乎上有讨论
    从爆栈网上其他人的答案来看 淘宝的却会检查自动化防范
    比如识别$cdc_asdjflasutopfhvcZLmcfl_、webdriver 这些关键字
    参考 https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver
    这个 cdc 我以为是个乱码 看上去就是这么检测的
    bmos
        2
    bmos  
       2018-09-12 09:46:53 +08:00
    上次看到一个帖子,网站也是用了 webdriver 关键字屏蔽,好像需要自己修改后再编译才能去除。
    golmic
        3
    golmic  
       2018-09-12 09:48:59 +08:00
    提供基于 http/s 请求的淘宝、天猫、支付宝登录方案,requests 实现,可用于生产环境
    kimqcn
        4
    kimqcn  
       2018-09-12 09:51:48 +08:00
    笨,登陆的时候用 Autoit 啊,进去了再用 selenium.
    xyfan
        5
    xyfan  
       2018-09-12 09:52:36 +08:00
    别说模拟登陆,我正常登陆都登陆不上去,过不去滑块验证,不知道怎么就把我识别为机器人了。
    caibou
        6
    caibou  
    OP
       2018-09-12 10:06:07 +08:00
    @xyfan 正常登录可以呀, 我正常打开 chrome 一切正常。
    imn1
        7
    imn1  
       2018-09-12 10:08:44 +08:00
    @xyfan +1
    me2,虚拟机 ie 进不去,但 host(linux) chromium 则可以
    qwertty01
        8
    qwertty01  
       2018-09-12 10:23:37 +08:00
    @kimqcn 既然登录可以检测,你使用 selenium 一样可以检测,治标不治本。
    xyfan
        9
    xyfan  
       2018-09-12 11:02:54 +08:00 via Android
    @caibou 肯定大部分人都可以正常登录,但是我手动都登录不上去,淘宝的验证方法肯定是有些问题。
    dcatfly
        10
    dcatfly  
       2018-09-12 12:47:51 +08:00
    改一下浏览器头?不太确定这个原理。另外推荐 Puppeteer。
    beforeuwait
        11
    beforeuwait  
       2018-09-12 13:40:41 +08:00
    4 楼靠谱
    slenium 一进去就被识别为爬虫了,过不了的。
    shapl
        12
    shapl  
       2018-09-12 14:16:17 +08:00
    直接调订单接口就是了。。。百度搜一下 taobao.tbk.sc.order.get
    caibou
        13
    caibou  
    OP
       2018-09-12 14:35:50 +08:00
    @shapl 这个要拥有高级权限才可以调用, 行不通的
    nilrust
        14
    nilrust  
       2018-09-12 14:40:31 +08:00
    反正最简单的浏览器油猴脚本完全可以解决需求。
    shapl
        15
    shapl  
       2018-09-12 14:42:21 +08:00
    @caibou #13 搜一下再说。
    caibou
        16
    caibou  
    OP
       2018-09-12 15:10:17 +08:00
    @shapl 兄弟有什么直说呀, 官方这个 api 是要有高级权限才提供的
    sujin190
        17
    sujin190  
       2018-09-12 15:20:40 +08:00
    而且以前似乎登录一次,你只要一直刷新,接近于使用,几乎不会掉出去,但是现在似乎有事没事踢出去,过几分钟就得重新登录一次,烦人的很
    realkenshinji
        18
    realkenshinji  
       2018-09-12 15:30:54 +08:00
    除了这个,我记得以前还要你从下面的图片里选出你曾经购买过的物品....
    jccg90
        19
    jccg90  
       2018-09-12 15:31:11 +08:00
    之前做过,登录部分要手动过验证,自动化总是出问题。。。然后加个微信告警通知,需要登录的时候提醒我连上去登录一下。。。
    caibou
        20
    caibou  
    OP
       2018-09-12 16:12:40 +08:00
    @sujin190
    @realkenshinji
    @jccg90
    我目前在淘宝联盟的订单抓取, 但是 50 分钟登录状态就过期了。 不知道有没有什么好方法。
    手动扫码登录肯定是不行的, 不可能人工 24 小时都在扫
    sujin190
        21
    sujin190  
       2018-09-12 16:48:06 +08:00
    @caibou #20 不知道用按键精灵之类的模拟鼠标点点点,能不能保持住登录状态
    Luxurious
        22
    Luxurious  
       2018-09-12 17:00:55 +08:00
    现在登录必须得选择已经购买的商品才行吧
    JasperYanky
        23
    JasperYanky  
       2018-09-12 17:05:17 +08:00
    1.挂阿里旺旺获取 ie 里面的插件拿 cookie
    2.调用订单接口,目前工具商已经有部分不完美的接口放出
    3.把我加入特别关注
    SpiderXiantang
        24
    SpiderXiantang  
       2018-09-12 18:15:01 +08:00
    我登上去过 selenium 用的微博账号
    SpiderXiantang
        25
    SpiderXiantang  
       2018-09-12 18:15:43 +08:00
    会跳滑块 但是能登陆 是个淘宝的小问题吧
    caibou
        26
    caibou  
    OP
       2018-09-12 21:34:32 +08:00
    @sujin190 不行, 我试过了,50 分钟之后必定要重新登录
    caibou
        27
    caibou  
    OP
       2018-09-13 10:09:18 +08:00
    @JasperYanky 你指的是 window 版的阿里旺旺吗
    JasperYanky
        28
    JasperYanky  
       2018-09-13 10:39:36 +08:00
    @caibou 是的,阿里旺旺会往 ie 里面插快捷登录
    fantasyni
        29
    fantasyni  
       2018-10-27 17:23:37 +08:00
    xposed 去 hook 淘宝自动扫码 怎么弄的?
    yu100
        30
    yu100  
       2019-01-13 13:25:47 +08:00
    @shapl 请问这个有什么特别的地方吗?百度了一圈,又在 top.api 的基础包里查看了,没发现这个权限啊。还请兄弟不吝赐教啊
    yu100
        31
    yu100  
       2019-01-13 13:44:20 +08:00
    @yu100
    @shapl 已明白,谢谢
    wjx1993
        32
    wjx1993  
       2019-02-15 10:21:01 +08:00
    @yu100 还是不太明白,你是怎么解决的?求指导一下
    caibou
        33
    caibou  
    OP
       2019-02-15 11:18:52 +08:00
    @wjx1993 用 28 楼说的方法吧。 我之前用 xposed 插件去自动扫码比较麻烦。
    wjx1993
        34
    wjx1993  
       2019-02-15 13:40:44 +08:00
    "挂阿里旺旺获取 ie 里面的插件拿 cookie"这句是什么意思?在 IE 上登录阿里旺旺,什么插件?@caibou
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5293 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 61ms UTC 01:39 PVG 09:39 LAX 17:39 JFK 20:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86