
最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了
之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011
大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用
1 wyntalgeer 1 天前 真有人用中转写代码? |
2 kfpenn 1 天前 @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用 |
3 106npo 1 天前 via Android 用中转站就做好会用来被蒸馏的打算呗 |
4 freak118 1 天前 这玩意儿是不是搞个用户协议就完全免责了 |
5 daimaosix 1 天前 用开源程序自建的中转自用应该 OK 的吧 |
6 harlen 1 天前 我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖 |
7 JoeDH 1 天前 我就说现在怎么那么多免费公益中转站,额度全跟不要钱的往外送,特别是隔壁冒出来一大堆 |
8 gdkttt 1 天前 还是不能贪便宜用中转站,还是老实去买官方的 |
9 xFrye 1 天前 都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路 |
10 LunaSeki 1 天前 用中转都默认会被偷数据吧 一些 coding plan 也会默认授权用于训练 |
11 augustcc 1 天前 emm 无所谓的项目用中转。其他我都是用 team |
12 evamayy 1 天前 中转一般数据都会上传的吧 |
13 lujiaosama 1 天前 中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢? |
14 Lockroach 1 天前 总结一下上面内容就是:用中转就做好数据被出售的预期。 |
15 akakcolin 1 天前 你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用 |
16 VeteranCat 1 天前 现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢? 这些中转站更是卖起来毫无心理负担。 |
17 Shielber 1 天前 我说我的 tg 号怎么用着好好的被封了 |
18 p2007 1 天前 中转站基本没有任何信誉,不跑路就已经很难得了 |
19 everettjf 1 天前 开源项目写一些倒是无所谓。。。 |
20 tommyshelbyV2 1 天前 用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖 |
22 calmbinweijin 1 天前 我可没有,我纯白,目前已亏 500R |
23 jiirouwei 1 天前 用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系 |
24 cat 1 天前 openrouter 和 vercel ai gateway 呢? |
25 freak118 1 天前 @calmbinweijin 这还能亏吗 中转的成本是啥 |
27 a1exlism 1 天前 用中转就怕这个,所以能自建一定是自建优先的 |
28 yuexiahaowu 1 天前 官司的破代码,心里有数,无所谓的 |
29 PC9528 1 天前 我用第三方中转已经默认会被拿去训练了... |
30 crime1024 1 天前 没事 用来养虾额 |
31 lovelive1024 1 天前 中转都是默认没隐私 |
32 calmbinweijin 1 天前 @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的 |
33 poorcai 1 天前 话说 team 账号现在怎么开通啊?官网没看到 |
34 kfpenn 1 天前 @lujiaosama 有啊,cursor 的 share data 还不允许取消 |
35 ano 1 天前 @lujiaosama 想什么呢,包被拿去训练的,900%。 区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。 |
36 timeance 1 天前 幸好我用中转都是翻译黄油 |
37 sommio 1 天前 像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺, 能降低 API 价格和同时增强国产模型的结果也算还可以了( |
38 penisulaS 1 天前 我的代码怀疑都是污染大模型的 |
39 nbndco   1 天前 中转就是默认蒸馏啊,只要不在乎就挺好的 |
40 dko 1 天前 拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。 |
41 dockerhub 1 天前 擦,我怎么没人找我。我的服务器两天的日志都存不下 |
43 Meteora626 1 天前 @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的, |
44 catazshadow 1 天前 via Android 岂止训练,起手就是 grep 'pwd|pubkey|cred' |
45 isnullstring 1 天前 用谁都一样,中转卖、官方的自己用 |
46 rfv2 1 天前 via Android 官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转 |
47 unusualcat 1 天前 1USDT 50 条会话?这玩意这么值钱啊! |
48 v2exgo OP @unusualcat 要那种单次对话的 |
49 aarontian 1 天前 能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了 |
50 goodboy95 1 天前 via Android 我连用官方的都默认数据全交出去了 |
51 ideard 1 天前 还好我是自建,免费的东西代价太大了 |
52 JoshTheLegend 1 天前 别说中转了,用官方的不都是默认全交的吗... |
53 unixcs 1 天前 via Android 比起我的数据,我更想省点 token 的钱 |
54 unusualcat 19 小时 3 分钟前 没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来 |
55 v2exgo OP @unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了 |
56 LowBi 17 小时 16 分钟前 官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。 |
57 MoozLee 16 小时 55 分钟前 我的破代码被拿去蒸馏了,我有什么损失吗? |
58 dabingbing 16 小时 29 分钟前 在乎这个? |
61 luckywuuuuu 14 小时 58 分钟前 @sommio 有的,gpt 网页版可以设置不用于模型训练。但是,这种东西只有大企业说的你还可以信一点。。。 ps: 其实正常人和公司不怕主流的大模型学习到了,因为激活这个信息的概率太低了,怕就怕别人不拿来训练拿来扒提示词 |
62 toriagpiosk 14 小时 44 分钟前 前端时间就发现了,大量灰产组织开始和AI API 中转站出现交易,其中很多都是公益站 <img src="https://tc.7zz.cn/i/2026/03/12/35c2a3d28a994684387b7f7b6df35934.png" alt="image" /> |
63 chi1st 14 小时 40 分钟前 官方就不用你数据了?你在 V 站的发言也早就被拿去训练了。。。 |
65 zomco 13 小时 53 分钟前 他不会以为我用中转站是干正经事的吧 |
66 jiangzm 13 小时 9 分钟前 做中转站的真恶心 |
67 streamrx 12 小时 49 分钟前 via iPhone 用中转站不就是默认数据 100%会被使用和出售吗 |
68 click04 12 小时 18 分钟前 理论上中转站确实具有很高的超级权限: 1. 看到所有用户输入的信息 2. 编码/养虾场景可以在大模型响应中加上额外的任意命令 相当于把远程操作能力交给了一个没那么可信的组织。 有很多公益免费的站点不知道他们热衷建站的目的,为了技术平权? |
69 boboboka 11 小时 17 分钟前 不知道是不是公益站会出现,我现在用的几个付费中转,倒是都说不会保存,也不知道是不是真的 |
70 635925926 11 小时 10 分钟前 问题来了,能不能反向污染呢。比如搞一个项目的变量名全是拼音。 |
71 eya46 11 小时 9 分钟前 官方的也一样,买的豆包 coding plan 明确写着可用于训练 |
72 evamayy 10 小时 14 分钟前 免费的才是最贵的,你以为你在用便宜的 API ,其实你自己才是产品 |
73 nyfwan123 7 小时 39 分钟前 我是做中转的 确实有人找我买过 但是我硬盘就 40 个 G 还有自己的数据 且都是老朋友在用 所以拒绝了采购 |