
1 missqso Apr 27, 2015 谢谢 |
2 alsacegustav Apr 28, 2015 好用,文字、图片、格式抓取过来都正常,希望能长期使用,加油 |
3 wlwr OP @alsacegustav 会长期维护,谢谢支持哈 |
4 wizos Apr 28, 2015 用inoreader时,抓取的内容会直接显示标签…… |
5 m3ng9i Apr 28, 2015 不错。另外有一些符号,比如英文圆括号能不能不要编码成 ( 和 ) 啊? |
6 m3ng9i Apr 28, 2015 这个地址报错:Internal Server Error http://rss.wlwr.net/weixin/oIWsFt_fzFTmSWJ96bXXqFX0yHIQ |
7 ccbikai PRO 搜狗有反爬虫,你做处理了吗? |
8 XnEnokq9vkvVq4 Apr 28, 2015 用 inoreader 看时,有些会显示代码。。 |
9 siriusVtoEX Apr 28, 2015 @wizos 同样的问题 |
14 ccbikai PRO @ccbikai 不只是 IP ,还有 cookies ,有人 做过 http://bozpy.sinaapp.com/blog/24 |
15 mrjoel Apr 29, 2015 额 仔细看了下 是订阅公众号内容。。 |
16 wizos May 1, 2015 好像没用了…… |
18 mytion May 2, 2015 不错,已经收藏使用,希望长期保持。加油 |
22 zangbob May 5, 2015 @wlwr 感谢楼主的作品,希望能长期运行。 PS:貌似html代码过滤不干净。。。比如这个: http://rss.wlwr.net/weixin/oIWsFt2w7J2ciAdD722lQRr6_Tec |
24 xcz May 18, 2015 via Android 这个不做过滤在inoreader里面看见的真的很纠结啊,别的没有测试,楼主用什么RSS阅读器? |
26 berry10086 May 20, 2015 楼主是抓取搜狗的gzhjs这个地址吗 |
27 berry10086 May 20, 2015 现在好像又是数据采集异常 |
28 wizos May 22, 2015 换用http://weirss.me/吧 |
29 wlwr OP @berry10086 是的,搜狗接口做了加密处理,导致采集失败。问题已修复,可以正常使用了。 |
30 berry10086 May 23, 2015 @wlwr 我也试着写了一个,http://weirss.me,抓取是直接用selenium + phantomjs,解析js渲染后的html,不用考虑cookies和接口变化。但是问题是抓取速度太慢,有时会超时 |
31 berry10086 May 23, 2015 @wlwr 你的网站抓取非常快 |
32 wlwr OP @berry10086 当时也有考虑过phantomjs,但等待请求的资源过多,还是选择直接调接口。不过维护成本高些。 |
33 SolLo PRO 只能是订阅号嘛?不知为何搜狗搜不到我想找的服务号啊 |
34 Williamzhang515 May 25, 2015 题图似乎无法显示啊 |
36 wlwr OP @Williamzhang515 文章封面图的问题修复了,后面订阅的文章会显示封面图 |
39 sinosure May 27, 2015 @wlwr 奇怪,开始能跑,但运行一段时间后就再也不能跑了,始终报错 listening on port 3000 <-- GET / <-- GET / --> GET / 200 337ms - --> GET / 200 352ms - <-- GET /weixin/oIWsFt0GzJ9B8He5MfCo4DpkeYBg <-- GET /favicon.ico --> GET /favicon.ico 404 12ms - [SyntaxError: Unexpected end of input] --> GET /weixin/oIWsFt0GzJ9B8He5MfCo4DpkeYBg 200 3,074ms - |
41 vchard May 27, 2015 这个不错,就是有的文章只有标题没有内容。 |
42 gzany May 27, 2015 之前一直在用,很不错!! |
44 sinosure May 28, 2015 @berry10086 看来还是基于网页的最稳定啊,有考虑开源么 |
46 vchard May 29, 2015 无法更新了 |
47 fuckgfw May 29, 2015 采集异常,无法获取数据 |
48 berry10086 May 29, 2015 @sinosure 会开源的,但是现在还没有完全做好,还有一些问题 |
49 vchard May 29, 2015 已经很好了。恢复原装就可以,能更新就行! |
50 cainiao Jun 7, 2015 又挂了,无法采集了 |
51 wlwr OP @cainiao 恢复了。搜狗限制了频率,请求量较多会造成不定时抽风。建议取代码 https://github.com/wlwr/rss 自己搭建一个。 |
52 ulic95 Jun 18, 2015 现在又采集异常了 |
54 WenyiJi Jul 31, 2015 请问lz还在更新这个作品吗?网页打不开了 |
55 globetour Jul 9, 2016 via Android 安装后可以正常用,但是两个小问题。 1 ,系统后台运行一段时间后自动退出了,不知什么原因。 2 ,这个能绕过搜狗的反爬机制吗? |
56 globetour Jul 9, 2016 第 3 个问题 RSS 里好像是取每次群发的第一篇文章,其余的就没有了。 |
57 knightliao Dec 20, 2016 |
58 knightliao Jun 13, 2018 |