用django做的自维护的网站,无人职守 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
yaotian
V2EX    Python

用django做的自维护的网站,无人职守

  •  
  •   yaotian 2012-07-20 08:19:23 +08:00 7218 次点击
    这是一个创建于 4901 天前的主题,其中的信息可能已经有所发展或是发生改变。
    http://sche.mobi 自动收集,无人工干预。

    跑在VPS上,速度还可以吧?

    用了文件cache.

    连mysql数据库都没用。

    大家给点意见
    26 条回复    1970-01-01 08:00:00 +08:00
    Coda
        1
    Coda  
       2012-07-20 08:31:17 +08:00
    解析稍慢, 打开速度还可以~
    yaotian
        2
    yaotian  
    OP
       2012-07-20 08:32:09 +08:00
    @Coda 域名解析?
    Coda
        3
    Coda  
       2012-07-20 08:34:35 +08:00
    嗯, 感觉不是秒开~ 不过可以接受的. 毕竟不是国内的.
    manhere
        4
    manhere  
       2012-07-20 08:46:13 +08:00
    传说中的小偷程序嘛。
    chiang
        5
    chiang  
       2012-07-20 08:47:30 +08:00
    楼主,能不能写个能够关注租房信息的的分支功能呢。比如“安农大 校内”,有这字眼的词就出现在网站上。
    想在学校周围租个房子,却要每天蹲点在各大信息网站等刷新,很累的。
    yaotian
        6
    yaotian  
    OP
       2012-07-20 09:52:11 +08:00
    @manhere 啊?
    iiduce
        7
    iiduce  
       2012-07-20 09:54:26 +08:00
    定时任务用的哪个?
    helloboy
        8
    helloboy  
       2012-07-20 10:15:38 +08:00
    可以发篇文章讲解下大体架构方面的
    yaotian
        9
    yaotian  
    OP
       2012-07-20 10:41:32 +08:00
    @iiduce Crontab
    yaotian
        10
    yaotian  
    OP
       2012-07-20 10:51:18 +08:00
    @chiang 理论上这个平台可以收集不同的信息。
    但不是搜索引擎,是有针对性的收集。
    你觉得这个能形成一些商业模式吗?
    RisingV
        11
    RisingV  
       2012-07-20 11:09:14 +08:00
    @helloboy 有同感。望楼主不吝分享
    bshu
        12
    bshu  
       2012-07-20 11:09:17 +08:00
    这个不就是定时抓取特定网站特定栏目的特定信息么?然后封装一下就展示出来,功能是不是太简单了啊?
    chiang
        13
    chiang  
       2012-07-20 13:36:02 +08:00
    @yaotian 我(程序盲 愿意支付几块钱获得这样的服务。
    自己也想过弄一个这样的网址,就类似于可以自定义爬虫,虽然对程序员来说这东西不值一提,但是不失为一种及时筛选出需要信息的快速途径。到时候可以加上邮件,或者短信提醒。搜集到某信息后立即通知。
    csx163
        14
    csx163  
       2012-07-20 20:46:04 +08:00
    @chiang google已经有这种东西了,你写个关键词,天天给你发邮件。
    yaotian
        15
    yaotian  
    OP
       2012-07-20 21:32:38 +08:00
    @csx163 准吗? 我用过,没几个准的
    alsotang
        16
    alsotang  
       2012-07-21 16:53:29 +08:00
    @csx163
    @yaotian
    一点也不准,我订五月天的消息每周一次,每次发来的都不懂是些什么东西。。。
    fantasy614
        17
    fantasy614  
       2012-07-22 00:07:32 +08:00
    这。。。不就爬了个赶集的信息么,做起来应该挺简单的说
    kojp
        18
    kojp  
       2012-07-22 17:58:19 +08:00
    不错~~~~ 信息挺有用的。
    yaotian
        19
    yaotian  
    OP
       2012-07-23 14:55:43 +08:00
    @fantasy614 如果要爬很多个不同的网站呢。。。
    yaozhifeng
        20
    yaozhifeng  
       2012-07-23 17:23:58 +08:00
    bootstrap, 不错啊呵呵
    yaotian
        21
    yaotian  
    OP
       2012-07-24 00:30:10 +08:00
    今天更新了后台程序,提高了精度。增加连接池等稳定机制。
    页面上增加了按钮“曾被我抱过”
    iiduce
        22
    iiduce  
       2012-07-24 00:49:38 +08:00
    能讲讲“增加连接池等稳定机制”么
    @yaotian
    coldear
        23
    coldear  
       2012-07-24 01:28:21 +08:00
    @yaotian
    我正想着做个类似的东西,针对电子产品的,针对美国用户的
    lz不用数据库,是不是给每个用户建立了一个scheduled task, 定时去分析一下爬下来的网页?
    另外是不是有网页的cache? 不会每个用户都去重新爬一下吧?
    也可能我完全理解错了,希望能交流一下
    yaotian
        24
    yaotian  
    OP
       2012-07-24 10:37:46 +08:00   1
    @iiduce 我有篇博客可能对你有帮助 http://zhengyaotian.com/?p=178
    iiduce
        25
    iiduce  
       2012-07-24 11:20:54 +08:00
    有用,谢谢~
    moyerock
        26
    moyerock  
       2012-07-24 14:47:58 +08:00
    不错不错,速度可以
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     806 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 47ms UTC 21:25 PVG 05:25 LAX 13:25 JFK 16:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86