
目前开放注册免费使用 http://www.wechatposts.com/ 输入公众号名称提交任务,五分钟内方可到处所有文章列表
1 nyfwan123 Nov 24, 2017 求问后端大概实现思路 |
2 cqcn1991 Nov 24, 2017 好 NB... |
3 golmic Nov 24, 2017 via Android 大概是怎么实现的呢? |
4 br0x Nov 24, 2017 同求,楼主讲一下思路呗 |
5 grimpil Nov 24, 2017 via Android 只能采集十篇? |
6 deathql Nov 24, 2017 这个是怎么实现的 我也想知道 |
7 linKnowEasy Nov 24, 2017 魔鬼交际学... 抓取失败 |
8 LukeChien Nov 24, 2017 via Android 搜狗搜索抓的吧 |
9 utopia5719 Nov 24, 2017 试了一下,40 分钟了也没数据啊 |
10 jijiwaiwai OP @grimpil 可以采集所有 |
11 jijiwaiwai OP @LukeChien 不是 |
12 jijiwaiwai OP @utopia5719 提交的时候,请提交正确的“微信公众号名称”,注意区分大小写,且不是“微信号” |
13 jijiwaiwai OP @linKnowEasy 可以的,今天刚上线,测试的人数太多,可能抓取有延迟 |
14 deathql Nov 24, 2017 @jijiwaiwai web 微信吧 |
15 buir Nov 24, 2017 Service Temporarily Unavailable The server is temporarily unable to service your request due to maintenance downtime or capacity problems. Please try again later. Apache/2.2.15 (CentOS) Server at www.wechatposts.com Port 80 |
17 arens Nov 24, 2017 注册不能 |
18 buir Nov 24, 2017 直接 503 玩死了~ |
19 jijiwaiwai OP @buir 刷新 |
20 jijiwaiwai OP @deathql 也不是,哈哈 |
21 friejq Nov 24, 2017 望楼主分享思路? |
22 weer0026 Nov 24, 2017 正常应该搜狗来的,还记得之前造数分享了一个从微信公众号后台抓的办法。 |
23 mooncakejs Nov 24, 2017 微信拿 key,关注采集,数据问题不大,号多了就不好维护了。 |
24 missdeer Nov 24, 2017 503 Service Temporarily Unavailable The server is temporarily unable to service your request due to maintenance downtime or capacity problems. Please try again later. |
25 krasie Nov 24, 2017 Proxy Error The proxy server received an invalid response from an upstream server. |
26 luoshixiong Nov 24, 2017 打不开 凉了? |
27 faustina Nov 24, 2017 502 |
28 xsd3169 Nov 24, 2017 凉了凉了凉了。。 ``` <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> <html><head> <title>502 Proxy Error</title> </head><body> <h1>Proxy Error</h1> <p>The proxy server received an invalid response from an upstream server.<br /> The proxy server could not handle the request <em><a href="/">GET /</a></em>.<p> Reason: <strong>Error reading from remote server</strong></p></p> <hr> <address>Apache/2.2.15 (CentOS) Server at www.wechatposts.com Port 80</address> </body></html> ``` |
29 jijiwaiwai OP |
30 xsd3169 Nov 24, 2017 @jijiwaiwai 666 之前我通过 MITM 做过一个差不多的,然而部分操作依然需要手动 2333 |
31 ORZRRR Nov 24, 2017 大哥没有数据啊 |
32 anteros Nov 24, 2017 是关掉了吗?没抓到呀,就你的全球人工智能能抓到,其他的公众号都没用了,是你关掉服务了吗? |
33 deadofpeople Nov 24, 2017 关服务了吗 /? |
34 xsd3169 Nov 24, 2017 @jijiwaiwai 抓不到.. |
35 anthow Nov 24, 2017 老铁敢不敢告诉我一下下思路,嗯哼? |
36 jijiwaiwai OP @xsd3169 全自动搞定 |
37 AlwaysBee Nov 24, 2017 采集不了。。。。 |
38 AlwaysBee Nov 24, 2017 看采集结果是和搜狗的结果一样的,那需要解决的问题就是验证码,这个可以通过 IP 代理池来进行规避验证码,如果要采集历史文章,只能通过微信的客户端进行采集,而这个会遇到封号的问题 |
39 jijiwaiwai OP @AlwaysBee 并不是搜狗,我的是实时采集的 |
40 jijiwaiwai OP @php01 临时关了一下 |
41 Britter Nov 25, 2017 应该不是搜狗,搜狗限制太多了,这个应该是通过微信里边的机制来抓取的,之前也做过一套 |
42 AlwaysBee Nov 25, 2017 @jijiwaiwai 但是我试了,并没有把历史文章采集到,只有最近十天的文章 |
43 akaayy Nov 25, 2017 求分享思路。。 |
44 Crayon2022 Nov 26, 2017 求分享思路 |
45 golangggg Feb 14, 2020 原贴过去好久了.. 已经过期了, 我这里有一套现在可用的免费 api 爬虫 https://github.com/Edaaaaa/wx-spider 可以供大家参考 codes 里面有 php 和 py 的 demo 简单写一点逻辑就可以使用了 api 方式可以 在几分钟时间内从开发到上线.比起自己搭建 效率高了很多倍 如果对你有帮助的话 记得在 github 点一下 star 谢谢了~ |