
最近偶然看到很强大的网页抓取工具 headless chrome。学习了一下,很快就写了个小网页放到网上。
很简单的功能,输入一个网址,生成手机和桌面版本的全屏截图。(支持某些不存在的站点)
放出地址, 请各位把玩把玩 http://www.91urls.com
我在想这个东西有没有往后做的可能,比如把大家生成截图的网址列出来,大家可以点赞、收藏、评论。 问题是 url 可能包罗万象,没有集中的兴趣点。
各位有什么想法,一起探讨一下,顺便帮我带点流量过来。
1 onsale 2018 年 1 月 16 日 |
2 onsale 2018 年 1 月 16 日 |
3 zhtphoenix OP @onsale 下一步可以做抓取页面内容进行分析 |
4 7654 2018 年 1 月 16 日 用这个可以上班摸鱼哈 |
5 Sanko 2018 年 1 月 16 日 via Android 花式看 yellow pic |
6 northisland 2018 年 1 月 16 日 @我扶奶奶过哈登 |
7 zhtphoenix OP 兄弟们太火爆了,把我服务器搞挂了。。并发时性能还有问题 |
8 zhtphoenix OP 得先优化一下并发的性能了 |
9 AlwaysBee 2018 年 1 月 16 日 不错啊,之前一直用着 Full page screen capture 这个插件 |
10 Pudge1337 2018 年 1 月 16 日 via Android 不错,好玩! |
11 miaomiao888 2018 年 1 月 17 日 |
12 NUT 2018 年 1 月 17 日 ajax 这种没处理好。 都是白的 |
13 mclxly 2018 年 1 月 17 日 提个建议: 我之前想做的,是每天发送一张截图给微信,例如 jd 的产品价格页。 |
14 shapl 2018 年 1 月 17 日 怎么自己发了那么多请求??? |
15 kimown 2018 年 1 月 17 日 LZ 是依据什么判断页面已经加载完毕,然后截图的,例如页面是纯数据填充的,但由于网速,后端接口需要 10s 后才返回,那 LZ 什么时候截图呢 |
16 nine99 2018 年 1 月 17 日 好厉害!!非常好用!!就是如果需要登入的网站是不是就用不了? |
18 whileFalse 2018 年 1 月 17 日 看楼主的域名,果断生成了个 91p0rn 的截图。 |
19 253874 2018 年 1 月 17 日 不错 |
20 keventseng 2018 年 1 月 17 日 这是已经崩了吗? |
21 shenyu1996 2018 年 1 月 17 日 使用的 puppeteer 么?后台的服务器是 linux 么,昨天我也在搞这个抓了下 b 站我账号下的动态更新,windows 下运行没问题,但是想跑在服务器上有点麻烦 |
22 julu 2018 年 1 月 17 日 体验了下,很实用 |
23 Sunrise837 2018 年 1 月 17 日 类似 360IE 插件有个功能 保存网页为图片。 |
24 v9ex 2018 年 1 月 17 日 测试了下草榴,发现可以,服务器在香港? https://ww4.sinaimg.cn/large/a15b4afegy1fnjgknhx3vj20dc0hs75d |
25 zhtphoenix OP @shenyu1996 是 puppeteer, 在 ubuntu 上跑的 |
26 LeungJZ 2018 年 1 月 17 日 挂了。 |
27 zhtphoenix OP @v9ex 阿里云新加坡服务器 |
28 stalon 2018 年 1 月 17 日 https://developers.google.com/web/updates/2017/04/headless-chrome Taking screenshots To capture a screenshot of a page, use the --screenshot flag: chrome --headless --disable-gpu --screenshot https://www.chromestatus.com/ # Size of a standard letterhead. chrome --headless --disable-gpu --screenshot --window-size=1280,1696 https://www.chromestatus.com/ # Nexus 5x chrome --headless --disable-gpu --screenshot --window-size=412,732 https://www.chromestatus.com/ Running with --screenshot will produce a file named screenshot.png in the current working directory. If you're looking for full page screenshots, things are a tad more involved. There's a great blog post from David Schnurr that has you covered. Check out Using headless Chrome as an automated screenshot tool . |
30 marcomarco 2018 年 1 月 17 日 有点意思,收藏了,希望拓展出更多功能,比如一键给整站截图 手动斜眼 |
31 hydyy 2018 年 1 月 17 日 好玩好玩 |
32 jkjoke 2018 年 1 月 17 日 挺不错的 |
33 MonoLogueChi 2018 年 1 月 17 日 via Android |
34 xuyl 2018 年 1 月 17 日 |
35 woffee 2018 年 1 月 17 日 上班呢,楼上干什么呢(斜眼笑 |
36 livc 2018 年 1 月 17 日 不错,收藏了。 |
37 nexusone 2018 年 1 月 17 日 楼主的这个很 nice 啊,但是楼上的咱就别拿黄网做测试了 |
38 zhtphoenix OP @nexusone 老实说我做了这个后,才发现了好多本来不知道的小黄网,精神食粮更丰富了,感谢兄弟们 |
39 exuxu 2018 年 1 月 17 日 什么?小黄网,哪里哪里? |
40 wvidc 2018 年 1 月 17 日 |
41 shawn2333 2018 年 1 月 18 日 via iPhone 需要点一下“阅读全文”的怎么搞 |
42 mydns 2018 年 1 月 18 日 |
43 pandasoda 2018 年 1 月 18 日 做的不错,就是截图的网站标题有些移位 |
44 zhtphoenix OP @pandasoda 已经 fix, 谢谢 |
45 issue 2018 年 1 月 18 日 一些建议: 1.自动补全 http:// 2.params 支持中文 3.自动加载更多时,等它加载完再截图 4.有些网站需要登录 5.屏蔽一些关键词 47xxxxx62 |
46 zhtphoenix OP @ArchiTech 赞赞赞 |
47 zhtphoenix OP @laoganbu 难得的建设性意见,谢谢 |
48 mervin24 2018 年 1 月 25 日 检测广告法不错 加淘宝天猫上广告法检测 |
49 livc 2018 年 2 月 24 日 这么快就挂了? |
50 xshwy 2019 年 6 月 16 日 不知道怎么刷到这条,发现现在成了瑟情网站… |