
防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法
1 FrankFang128 2015-06-11 08:14:40 +08:00 via Android 把内容写在CSS里,使用你自己特制的字体,比如『我』的Unicode 码对应你 |
2 superliang 2015-06-11 08:19:08 +08:00 加干扰码或者异步加载内容,不过不管怎么防止采集对搜索引擎都不友好 |
3 banri 2015-06-11 08:29:22 +08:00 via iPhone 直接来源不就行了,妈妈再也不用担心被采集啦! 说真的都写前端了,就不要担心扒皮的事儿,因为100%可以被扒皮啊… |
4 banri 2015-06-11 08:29:39 +08:00 via iPhone :D 打错了是开源 |
5 kisshere 2015-06-11 08:46:29 +08:00 via Android 全部用js生成模板 |
6 binux 2015-06-11 08:51:32 +08:00 via Android 没有办法 |
7 lwbjing 2015-06-11 08:51:37 +08:00 canvas重绘。。 |
8 endoffight 2015-06-11 08:59:42 +08:00 js模板 selenium直接秒杀 |
9 typcn 2015-06-11 09:01:23 +08:00 修改 nginx 配置,listen 80 改成 listen 127.0.0.1:80 |
11 learnshare 2015-06-11 09:38:35 +08:00 后端直接渲染成图片 |
12 seerhut 2015-06-11 09:43:41 +08:00 只要字体规整,图片也能高效ocr.... |
13 gangsta 2015-06-11 09:46:51 +08:00 |
14 Busy 2015-06-11 09:50:17 +08:00 不可能,综上 |
15 onlyice 2015-06-11 09:52:25 +08:00via Android Canvas.... |
16 johnsmith123 2015-06-11 09:55:22 +08:00 怎么防止我发到网上的东西不会被复制? |
17 liujiantao 2015-06-11 10:10:11 +08:00 via Android 看看我这个 /t/157243 |
18 kokdemo 2015-06-11 10:10:33 +08:00 ……我觉得这只是增加了采集的门槛 但是也够了 |
19 thankyourtender 2015-06-11 10:14:06 +08:00 日他,正面刚他, |
20 Andy1999 2015-06-11 10:16:43 +08:00 via iPhone 屏蔽外部IP |
22 mcone 2015-06-11 11:36:21 +08:00 没办法 很难 百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的 |
24 amxku 2015-06-11 23:22:57 +08:00 其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做 |