
我想把一个网站上的文章爬取下来,有没有办法可以自动触发 chrome 插件(简悦),他可以重新排版,保存的日记中。但是怎么批量的去做这件事情呢?大家有什么 idea ?
1 6J73U552K5UVij4R 2021 年 7 月 13 日 用 selenium ?然后加载的时候把 chrome 插件 load 进去,再用 xpath 操作? |
3 itechify PRO 爬虫爬得好 |
4 ingdawn 2021 年 7 月 13 日 坐牢坐到老 |
5 seamonster 2021 年 7 月 13 日 真刑啊,日子越来越有判头了 |
6 zelentre 2021 年 7 月 13 日 很刑. |
7 HankLu> 2021 年 7 月 13 日 很简单 |
8 ztcaoll222 2021 年 7 月 13 日 先这样 |
9 HashV2 2021 年 7 月 13 日 再这样 |
10 tojike 2021 年 7 月 13 日 进去进得早 |
11 yunyuyuan 2021 年 7 月 13 日 然后再这样 |
12 nepiedg 2021 年 7 月 13 日 最后在这样 |
13 jingcoco 2021 年 7 月 13 日 有个 网联网记忆的 工具,初衷是解决有些网站过了几年下线了 没法看的问题。 |
14 kasusa 2021 年 7 月 13 日 python 写,selenium 库,模拟点击按钮,用 xpath 定位下一篇按钮,刷新再来。 就这么个流程吧。 不过我感觉网上还是垃圾信息多。都爬下来有什么用呢? |
15 caicaiwoshishui 2021 年 7 月 13 日 via iPhone 楼上队形笑死我 |
16 6J73U552K5UVij4R 2021 年 7 月 14 日 @hackingwu 可以的,用 js dom 就可以,xpath 估计也可以。 |
17 solopython 2021 年 7 月 14 日 试试 Newspaper3k |
18 muzuiget 2021 年 7 月 14 日 写个浏览器扩展就可以了,专事专办。 |