
1 freed 2013-06-23 10:26:46 +08:00 XX小偷? 这类小偷程序应该可以吧.. |
2 shiweifu 2013-06-23 10:28:59 +08:00 写个爬虫不就行了 |
3 twamix 2013-06-23 11:01:58 +08:00 火车头 AND ET2 |
4 jjplay 2013-06-23 11:32:53 +08:00 http://www.demo2.org/ 高端反向代理采集 |
8 xieren58 2013-06-23 14:21:18 +08:00 http://www.17qingsong.com/ 全自动,无人值守 |
10 yaotian 2013-06-23 14:38:59 +08:00 刚搞得,连域名都没有。 10秒抓一次。 http://zhengyaotian.com:9999 |
11 huip 2013-06-23 14:51:31 +08:00 这个应该很容易实现吧,把抓取的数据存储到数据库,然后在写一个中间件就可以了。 |
13 lyklykkkkkkk 2013-06-23 15:04:23 +08:00 许多据说『月入几万』的垃圾站就是这么干的,收集文章+挂广告 |
14 xieren58 2013-06-23 15:24:05 +08:00 @lyklykkkkkkk 对呀,我的那小站,每个月也能赚点~学那么多,不能变现,那也是白学~谁让生在天朝呢。一套房子压死很多程序猿了~ |
16 xieren58 2013-06-23 15:42:25 +08:00 @yaotian 没多少,ip平时一般有3k,百度有10几块一天,加上有淘宝,亚马逊,一号店那些,一个月至少几百,上千,没啥问题~ |
17 akira 2013-06-23 17:31:37 +08:00 肯定可以啊。。。不然你以为各种垃圾站怎么来的,还有各种采集软件,都是谁买的 |
19 yaotian 2013-06-23 18:28:10 +08:00 上面介绍的那个临时的站大家就别访问了, 和域名连上了 http://sche.mobi/ |
23 huazhouji 2013-06-23 18:55:21 +08:00 via iPhone 垃圾站不是很容易被搜索引擎降权之类的吗?需要采集后做什么处理吗?还是采集的渠道有讲究?望赐教 |
24 efi 2013-06-23 19:20:04 +08:00 有没有可能自动抓取网上邮箱并自动向邮箱发送广告? |
25 lovejoy 2013-06-23 19:20:16 +08:00 最讨厌这种网站,尤其是有些完全是关键字没有内容的网站 |
27 yaotian 2013-06-23 22:59:33 +08:00 @xieren58 真没看出来,不错。 我们建友情链接吧? 目前 http://sche.mobi 已经搞得相对满意了。 |
28 timothyye 2013-06-23 23:00:43 +08:00 这类的程序很多的 |
29 quake0day 2013-06-24 00:25:24 +08:00 这个自己写都不难,Python基础的urllib,urllib2库就能搞定。至于定时,用Crontab控制就行了。 |
31 PrideChung 2013-06-24 00:51:02 +08:00 建议你不要做这种无耻的行为。 |
33 tarsier 2013-06-24 01:25:46 +08:00 via Android 不是我自视清高,我觉得在这里讨论垃圾站采集站复制别人内容来赚钱的行为不好。 |
34 xiiing 2013-06-24 07:36:36 +08:00 网上原创文章并不多,很多门户网站也是转来转去的。转的时候加上来源是不是好一些? |
35 zippera OP @PrideChung 想到这个问题时纯粹是从技术角度出发的,也想练练手。看到大家讨论才意识到有些垃圾站是这么来的。但是,美味阅读这样的网站不也是采集来的吗? |
40 yaotian 2013-06-24 10:52:26 +08:00 |
42 PrideChung 2013-06-24 13:08:39 +08:00 via iPhone @zippera 美味爱读的网摘是ugc,并非自动采集。不过我觉得这样还是有问题,因为无论网站还是用户都没有得到原文作者的授权。 按照著作权法,全文转载是需要经过作者首肯的,即使保留了署名也需要作者同意。 |