用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
v2exgo
V2EX    程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

  •  5
     
  •   v2exgo 1 天前 10222 次点击

    最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

    之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011

    大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

    74 条回复    2026-03-12 19:59:26 +08:00
    wyntalgeer
        1
    wyntalgeer  
       1 天前
    真有人用中转写代码?
    kfpenn
        2
    kfpenn  
       1 天前
    @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
    106npo
        3
    106npo  
       1 天前 via Android
    用中转站就做好会用来被蒸馏的打算呗
    freak118
        4
    freak118  
       1 天前
    这玩意儿是不是搞个用户协议就完全免责了
    daimaosix
        5
    daimaosix  
       1 天前
    用开源程序自建的中转自用应该 OK 的吧
    harlen
        6
    harlen  
       1 天前
    我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
    JoeDH
        7
    JoeDH  
       1 天前
    我就说现在怎么那么多免费公益中转站,额度全跟不要钱的往外送,特别是隔壁冒出来一大堆
    gdkttt
        8
    gdkttt  
       1 天前
    还是不能贪便宜用中转站,还是老实去买官方的
    xFrye
        9
    xFrye  
       1 天前
    都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
    LunaSeki
        10
    LunaSeki  
       1 天前
    用中转都默认会被偷数据吧
    一些 coding plan 也会默认授权用于训练
    augustcc
        11
    augustcc  
       1 天前
    emm 无所谓的项目用中转。其他我都是用 team
    evamayy
        12
    evamayy  
       1 天前
    中转一般数据都会上传的吧
    lujiaosama
        13
    lujiaosama  
       1 天前
    中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
    Lockroach
        14
    Lockroach  
       1 天前
    总结一下上面内容就是:用中转就做好数据被出售的预期。
    akakcolin
        15
    akakcolin  
       1 天前
    你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
    VeteranCat
        16
    VeteranCat  
       1 天前
    现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

    这些中转站更是卖起来毫无心理负担。
    Shielber
        17
    Shielber  
       1 天前
    我说我的 tg 号怎么用着好好的被封了
    p2007
        18
    p2007  
       1 天前
    中转站基本没有任何信誉,不跑路就已经很难得了
    everettjf
        19
    everettjf  
       1 天前
    开源项目写一些倒是无所谓。。。
    tommyshelbyV2
        20
    tommyshelbyV2  
       1 天前
    用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
    009694
        21
    009694  
       1 天前 via iPhone
    @freak118 灰产 随时可以跑路 需要什么用户协议
    calmbinweijin
        22
    calmbinweijin  
       1 天前
    我可没有,我纯白,目前已亏 500R
    jiirouwei
        23
    jiirouwei  
       1 天前
    用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系
    cat
        24
    cat  
       1 天前
    openrouter 和 vercel ai gateway 呢?
    freak118
        25
    freak118  
       1 天前
    @calmbinweijin 这还能亏吗 中转的成本是啥
    v2exgo
        26
    v2exgo  
    OP
       1 天前
    @freak118 #25 cdn 服务器 都要钱的
    a1exlism
        27
    a1exlism  
       1 天前
    用中转就怕这个,所以能自建一定是自建优先的
    yuexiahaowu
        28
    yuexiahaowu  
       1 天前
    官司的破代码,心里有数,无所谓的
    PC9528
        29
    PC9528  
       1 天前
    我用第三方中转已经默认会被拿去训练了...
    crime1024
        30
    crime1024  
       1 天前
    没事 用来养虾额
    lovelive1024
        31
    lovelive1024  
       1 天前
    中转都是默认没隐私
    calmbinweijin
        32
    calmbinweijin  
       1 天前
    @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
    poorcai
        33
    poorcai  
       1 天前
    话说 team 账号现在怎么开通啊?官网没看到
    kfpenn
        34
    kfpenn  
       1 天前
    @lujiaosama 有啊,cursor 的 share data 还不允许取消
    ano
        35
    ano  
       1 天前
    @lujiaosama 想什么呢,包被拿去训练的,900%。
    区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
    timeance
        36
    timeance  
       1 天前
    幸好我用中转都是翻译黄油
    sommio
        37
    sommio  
       1 天前
    像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
    能降低 API 价格和同时增强国产模型的结果也算还可以了(
    penisulaS
        38
    penisulaS  
       1 天前   1
    我的代码怀疑都是污染大模型的
    nbndco
        39
    nbndco  
       1 天前
    中转就是默认蒸馏啊,只要不在乎就挺好的
    dko
        40
    dko  
       1 天前
    拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
    dockerhub
        41
    dockerhub  
       1 天前
    擦,我怎么没人找我。我的服务器两天的日志都存不下
    v2exgo
        42
    v2exgo  
    OP
       1 天前
    @dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
    Meteora626
        43
    Meteora626  
       1 天前
    @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
    catazshadow
        44
    catazshadow  
       1 天前 via Android   3
    岂止训练,起手就是 grep 'pwd|pubkey|cred'
    isnullstring
        45
    isnullstring  
       1 天前
    用谁都一样,中转卖、官方的自己用
    rfv2
        46
    rfv2  
       1 天前 via Android
    官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
    unusualcat
        47
    unusualcat  
       1 天前
    1USDT 50 条会话?这玩意这么值钱啊!
    v2exgo
        48
    v2exgo  
    OP
       1 天前
    @unusualcat 要那种单次对话的
    aarontian
        49
    aarontian  
       1 天前
    能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
    goodboy95
        50
    goodboy95  
       1 天前 via Android
    我连用官方的都默认数据全交出去了
    ideard
        51
    ideard  
       1 天前
    还好我是自建,免费的东西代价太大了
    JoshTheLegend
        52
    JoshTheLegend  
       1 天前
    别说中转了,用官方的不都是默认全交的吗...
    unixcs
        53
    unixcs  
       1 天前 via Android
    比起我的数据,我更想省点 token 的钱
    unusualcat
        54
    unusualcat  
       19 小时 3 分钟前
    没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来
    v2exgo
        55
    v2exgo  
    OP
       18 小时 54 分钟前
    @unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了
    LowBi
        56
    LowBi  
       17 小时 16 分钟前
    官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。
    MoozLee
        57
    MoozLee  
       16 小时 55 分钟前   1
    我的破代码被拿去蒸馏了,我有什么损失吗?
    dabingbing
        58
    dabingbing  
       16 小时 29 分钟前
    在乎这个?
    viking602
        59
    viking602  
       16 小时 14 分钟前
    @freak118 #4 中转站本身就不是什么正经营生 爱用就用的那种基本上
    beijiaoff
        60
    beijiaoff  
       15 小时 5 分钟前
    @rfv2 我觉得从技术上完全可以。就是中转本身就是灰色的……
    luckywuuuuu
        61
    luckywuuuuu  
       14 小时 58 分钟前
    @sommio 有的,gpt 网页版可以设置不用于模型训练。但是,这种东西只有大企业说的你还可以信一点。。。
    ps: 其实正常人和公司不怕主流的大模型学习到了,因为激活这个信息的概率太低了,怕就怕别人不拿来训练拿来扒提示词
    toriagpiosk
        62
    toriagpiosk  
       14 小时 44 分钟前
    前端时间就发现了,大量灰产组织开始和AI API 中转站出现交易,其中很多都是公益站

    <img src="https://tc.7zz.cn/i/2026/03/12/35c2a3d28a994684387b7f7b6df35934.png" alt="image" />
    chi1st
        63
    chi1st  
       14 小时 40 分钟前
    官方就不用你数据了?你在 V 站的发言也早就被拿去训练了。。。
    nVic
        64
    nVic  
       14 小时 37 分钟前
    @chi1st 一般来说你不会选择在 v 站发自己的敏感信息
    zomco
        65
    zomco  
       13 小时 53 分钟前
    他不会以为我用中转站是干正经事的吧
    jiangzm
        66
    jiangzm  
       13 小时 9 分钟前
    做中转站的真恶心
    streamrx
        67
    streamrx  
       12 小时 49 分钟前 via iPhone
    用中转站不就是默认数据 100%会被使用和出售吗
    click04
        68
    click04  
       12 小时 18 分钟前
    理论上中转站确实具有很高的超级权限:
    1. 看到所有用户输入的信息
    2. 编码/养虾场景可以在大模型响应中加上额外的任意命令
    相当于把远程操作能力交给了一个没那么可信的组织。
    有很多公益免费的站点不知道他们热衷建站的目的,为了技术平权?
    boboboka
        69
    boboboka  
       11 小时 17 分钟前
    不知道是不是公益站会出现,我现在用的几个付费中转,倒是都说不会保存,也不知道是不是真的
    635925926
        70
    635925926  
       11 小时 10 分钟前   1
    问题来了,能不能反向污染呢。比如搞一个项目的变量名全是拼音。
    eya46
        71
    eya46  
       11 小时 9 分钟前
    官方的也一样,买的豆包 coding plan 明确写着可用于训练
    evamayy
        72
    evamayy  
       10 小时 14 分钟前
    免费的才是最贵的,你以为你在用便宜的 API ,其实你自己才是产品
    nyfwan123
        73
    nyfwan123  
       7 小时 39 分钟前
    我是做中转的 确实有人找我买过 但是我硬盘就 40 个 G 还有自己的数据 且都是老朋友在用 所以拒绝了采购
    v2exgo
        74
    v2exgo  
    OP
       6 小时 19 分钟前
    @click04 一些是用爱发电吧
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1141 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 18:19 PVG 02:19 LAX 11:19 JFK 14:19
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86