分享下我和同学一起写的博客,主要关于计算机,算法,数学,和天文。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
EricZ
V2EX    分享创造

分享下我和同学一起写的博客,主要关于计算机,算法,数学,和天文。

  •  
  •   EricZ
    ekzhu 2011-07-29 13:03:47 +08:00 8467 次点击
    这是一个创建于 5257 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Mind Candies

    http://c6h12o6.org

    我们几个暑期都留在学校和教授一起做研究课题(不同的学校,不同的课题),平时学到的一些有趣的东西,就在这个博客上分享。我写的比较偏理论,我的同学也有比较偏技术的。

    主要是自娱自乐~

    欢迎大家拍砖~
    38 条回复    1970-01-01 08:00:00 +08:00
    amyhyde
        1
    amyhyde  
       2011-07-29 13:07:51 +08:00
    域名很有趣~~
    shawiz
        2
    shawiz  
       2011-07-29 13:27:36 +08:00
    写的很深入,赞!
    linchanx
        3
    linchanx  
       2011-07-29 13:34:24 +08:00 via iPad
    打不开 挂代理后可以了
    heidour
        4
    heidour  
       2011-07-29 13:39:24 +08:00
    查了一下,原来是葡萄糖 - -
    amyhyde
        5
    amyhyde  
       2011-07-29 13:59:20 +08:00
    顺着这个博客主题 找到了一个做主题很赞的wordpress themer
    rse43
        6
    rse43  
       2011-07-29 14:07:24 +08:00
    @heidour 只有分子式确定不了是葡萄糖吧,同分异构体那么多
    hanliinter
        7
    hanliinter  
       2011-07-29 14:09:17 +08:00
    看到天文就点进去了,结果没有啊
    makoR
        8
    makoR  
       2011-07-29 14:09:49 +08:00
    真的好有趣,订阅:)
    tf2
        9
    tf2  
       2011-07-29 14:30:58 +08:00
    太赞了。。。

    @heidour

    这个网站的captcha可以做成,给出一个分子图,请写出化学式
    bcxx
        10
    bcxx  
       2011-07-29 14:33:35 +08:00
    @lambdaq 我觉得让你数同分异构体就很好玩了……
    heidour
        11
    heidour  
       2011-07-29 15:49:12 +08:00
    @lambdaq @rse43
    啊,文科生已经主动搜索了,请各位不要追问。我不懂。
    还请普及。
    EricZ
        12
    EricZ  
    OP
       2011-07-29 23:19:30 +08:00
    @shawiz 哈哈谢谢!
    EricZ
        13
    EricZ  
    OP
       2011-07-29 23:21:49 +08:00
    @linchanx :o 哦天那,难道被墙了。
    EricZ
        14
    EricZ  
    OP
       2011-07-29 23:22:29 +08:00
    @amyhyde 恩这个主题特别清新
    EricZ
        15
    EricZ  
    OP
       2011-07-29 23:22:56 +08:00
    @hanliinter 以后会有的,写天文的那位还没有开始~
    EricZ
        16
    EricZ  
    OP
       2011-07-29 23:23:52 +08:00
    @makoR 谢谢!
    EricZ
        17
    EricZ  
    OP
       2011-07-29 23:25:08 +08:00
    @rse43 其实就是葡萄糖啦。名字叫mind candies么,也算是有点联系
    EricZ
        18
    EricZ  
    OP
       2011-07-29 23:25:59 +08:00
    @heidour 文科生能主动搜索就是好样的 :)
    liyandong
        19
    liyandong  
       2011-07-30 00:29:52 +08:00
    文科生已经明白了…哈哈…有意思
    bluef
        20
    bluef  
       2011-07-30 01:03:15 +08:00
    页面底部的的RSS Feed链接所指向的地址有点小问题
    linnchord
        21
    linnchord  
       2011-07-30 01:10:26 +08:00
    右下角feed链接多了一个标点,改改 :)
    EricZ
        22
    EricZ  
    OP
       2011-07-30 05:48:52 +08:00
    @bluef @linnchord 谢啦已经改过来了。
    pmonkey
        23
    pmonkey  
       2011-07-30 08:49:50 +08:00
    很赞!希望保持文章更新速度~
    持续关注ing
    Aragon
        24
    Aragon  
       2011-07-30 17:49:07 +08:00
    域名真恶心,怎么像个学化学的人的域名
    bcxx
        25
    bcxx  
       2011-07-30 17:56:40 +08:00
    @Aragon 为什么分子式会恶心呢? 你不懂 nerd 的美啊~
    timshi
        26
    timshi  
       2011-07-31 00:56:08 +08:00   1
    不知道是不是我没理解清楚,“菜篮子算法“里开始提的两种算法其实没有区别?要得到第二种算法里得矩阵,是否需要经过和第一种算法一样得过程?还是用了其他得办法?按文章里描述的,这两个算法应该都是 o(m*n)(假设每行的单词数不变,m 为行数, n 为给出的字符串的长度)。 我觉的如果用 hash table 取代你的矩阵可能有更好的结果。

    1。 把每行字拆成单词。
    2。 用单词作为插入hash table的key, 用行数作为hash table的value,把每行的单词插入hash table,得到类似下面的例子

    dell: 1, 3, 4, 5, 7
    windows: 2, 4, 7, 10
    xp: 4,7,11

    在这个例子里,“dell”出现在第1,3,4,5,7行,"windows"在2,4,7,10行。

    3。在给出一个字符串的情况下,用字符串里的单词为key,去找hashtable所对应的value。比如找 {dell,xp}, 得出{1,3,4,5,7}和 {4,7,11}两个array。两个数列如果有重叠的部分就说明所要找的字符串存在。

    用这个算法,1,2两个步骤是O(m+n), 第3个步骤里,hash table查找数据平均是O(1). 寻找array的重叠部分可以先排序,然后同时step over两个list,应该是O(n*log(n)) + O(n),这里的n指array的长度,n应该相对已经比较小了。另外在查多个单词的时候这里还可以有一些优化。比如从array长度最小的两个array开始比较,如果得出的集合为空,那么就可以停止运算。
    Celly0130
        27
    Celly0130  
       2011-07-31 14:53:19 +08:00
    每篇都看过去了,学习了,另外好像现在只有你一个人发啊,关注
    dofine
        28
    dofine  
       2011-07-31 16:39:53 +08:00
    看到域名就激动了,结果发现没有化学的东西啊。。
    EricZ
        29
    EricZ  
    OP
       2011-08-03 02:16:57 +08:00
    @Celly0130 现在我同学发了新的~
    EricZ
        30
    EricZ  
    OP
       2011-08-03 02:23:52 +08:00
    @timshi 谢谢你的提示。我会去试试看。

    第二种算法中得到矩阵的办法,是在第一次读取数据(文本文档)时,一边读一边构建的。也是用hash table,key是单词,value是关于n个行的向量。每读取一个新的词就创建一个新的hash key和向量。
    sparklo
        31
    sparklo  
       2011-08-03 02:49:40 +08:00
    @EricZ 和 @timshi 都是trt的, 你们可以见面讨论 xD
    EricZ
        32
    EricZ  
    OP
       2011-08-03 08:39:59 +08:00
    @timshi 没错,你的方法的确快了很多。我应该要更新下文章了~
    EricZ
        33
    EricZ  
    OP
       2011-08-03 08:59:09 +08:00
    @sparklo @timshi wow,牛人!
    avatasia
        34
    avatasia  
       2011-08-03 10:02:59 +08:00
    @EricZ 天文学 漂亮
    Sycro
        35
    Sycro  
       2011-08-03 10:18:39 +08:00
    @amyhyde 域名:C6H12O6
    葡萄糖的化学式?!
    timshi
        36
    timshi  
       2011-08-06 01:21:46 +08:00
    @EricZ

    谢谢你在博客上的mention, 你写的很简单明了,比我说的清楚 :)你现在是大几?
    EricZ
        37
    EricZ  
    OP
       2011-08-06 01:48:18 +08:00
    @timshi :) 下个学期大三了,Engineering Science的~
    timshi
        38
    timshi  
       2011-08-06 02:28:26 +08:00
    @EricZ 哈哈,怪不得你们博客上什么都有。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2184 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 00:33 PVG 08:33 LAX 16:33 JFK 19:33
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86