
1 amyhyde 2011-07-29 13:07:51 +08:00 域名很有趣~~ |
2 shawiz 2011-07-29 13:27:36 +08:00 写的很深入,赞! |
3 linchanx 2011-07-29 13:34:24 +08:00 via iPad 打不开 挂代理后可以了 |
4 heidour 2011-07-29 13:39:24 +08:00 查了一下,原来是葡萄糖 - - |
5 amyhyde 2011-07-29 13:59:20 +08:00 顺着这个博客主题 找到了一个做主题很赞的wordpress themer |
7 hanliinter 2011-07-29 14:09:17 +08:00 看到天文就点进去了,结果没有啊 |
8 makoR 2011-07-29 14:09:49 +08:00 真的好有趣,订阅:) |
15 EricZ OP @hanliinter 以后会有的,写天文的那位还没有开始~ |
19 liyandong 2011-07-30 00:29:52 +08:00 文科生已经明白了…哈哈…有意思 |
20 bluef 2011-07-30 01:03:15 +08:00 页面底部的的RSS Feed链接所指向的地址有点小问题 |
21 linnchord 2011-07-30 01:10:26 +08:00 右下角feed链接多了一个标点,改改 :) |
23 pmonkey 2011-07-30 08:49:50 +08:00 很赞!希望保持文章更新速度~ 持续关注ing |
24 Aragon 2011-07-30 17:49:07 +08:00 域名真恶心,怎么像个学化学的人的域名 |
26 timshi 2011-07-31 00:56:08 +08:00 不知道是不是我没理解清楚,“菜篮子算法“里开始提的两种算法其实没有区别?要得到第二种算法里得矩阵,是否需要经过和第一种算法一样得过程?还是用了其他得办法?按文章里描述的,这两个算法应该都是 o(m*n)(假设每行的单词数不变,m 为行数, n 为给出的字符串的长度)。 我觉的如果用 hash table 取代你的矩阵可能有更好的结果。 1。 把每行字拆成单词。 2。 用单词作为插入hash table的key, 用行数作为hash table的value,把每行的单词插入hash table,得到类似下面的例子 dell: 1, 3, 4, 5, 7 windows: 2, 4, 7, 10 xp: 4,7,11 在这个例子里,“dell”出现在第1,3,4,5,7行,"windows"在2,4,7,10行。 3。在给出一个字符串的情况下,用字符串里的单词为key,去找hashtable所对应的value。比如找 {dell,xp}, 得出{1,3,4,5,7}和 {4,7,11}两个array。两个数列如果有重叠的部分就说明所要找的字符串存在。 用这个算法,1,2两个步骤是O(m+n), 第3个步骤里,hash table查找数据平均是O(1). 寻找array的重叠部分可以先排序,然后同时step over两个list,应该是O(n*log(n)) + O(n),这里的n指array的长度,n应该相对已经比较小了。另外在查多个单词的时候这里还可以有一些优化。比如从array长度最小的两个array开始比较,如果得出的集合为空,那么就可以停止运算。 |
27 Celly0130 2011-07-31 14:53:19 +08:00 每篇都看过去了,学习了,另外好像现在只有你一个人发啊,关注 |
28 dofine 2011-07-31 16:39:53 +08:00 看到域名就激动了,结果发现没有化学的东西啊。。 |