Python 中哪个库可以获取一个网页元素的 XPath? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
exploitcat
V2EX    问与答

Python 中哪个库可以获取一个网页元素的 XPath?

  •  1  
  •   exploitcat 2016-01-14 15:45:30 +08:00 4117 次点击
    这是一个创建于 3640 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近有个需求,就是拿到一个网页的源代码,然后找到其中元素对应的 XPath ,在 Python 中完成。
    类似于 Chrome 中的"Copy XPath"功能。
    伸手党想问一下有没有现成的 Python 库可以解决?

    8 条回复    2019-12-10 13:53:08 +08:00
    leisurelylicht
        1
    leisurelylicht  
       2016-01-14 15:48:33 +08:00
    from lxml import etree

    或者

    beautifulsoup
    exploitcat
        2
    exploitcat  
    OP
       2016-01-14 15:59:07 +08:00
    @leisurelylicht 有没有 demo 呢? 可以获取指定 element 的 xpath ?
    bdbai
        3
    bdbai  
       2016-01-14 17:56:15 +08:00 via iPhone
    楼上说的是通过 XPath 选择元素吧。
    为什么要用 Python 生成 XPath ?如何确定是哪一个元素?
    imn1
        4
    imn1  
       2016-01-14 18:36:29 +08:00
    同一元素 xpath 有多种写法
    最简单的方法是你自己递归父节点,直到 root 节点
    exploitcat
        5
    exploitcat  
    OP
       2016-01-14 19:42:58 +08:00
    @bdbai 需求往往不需要解释。。。。
    leisurelylicht
        6
    leisurelylicht  
       2016-01-15 09:47:12 +08:00
    @exploitcat 好像没有,需要你自己生成
    wwxiong
        7
    wwxiong  
       2016-01-15 10:28:32 +08:00
    @exploitcat 可以看看 https://github.com/wwxiong/spiders/blob/master/meizi_spider.py 爬虫。里面就是使用 lxml 。
    ruiruirui
        8
    ruiruirui  
       2019-12-10 13:53:08 +08:00
    楼主是如何解决这个问题的,我现在也有个这么一个需求。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2447 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 03:29 PVG 11:29 LAX 19:29 JFK 22:29
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86