新手问问大佬们, AI IDE 或 大模型数据安全问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
lixuda
V2EX    程序员

新手问问大佬们, AI IDE 或 大模型数据安全问题

  •  
  •   lixuda 4 小时 47 分钟前 1004 次点击

    虽然很多他们写的隐私告知 代码会参与训练或不训练,那么完整代码泄露风险有多大?有这个被爆出来的案例吗?

    第 1 条附言    2 小时 47 分钟前
    如果拿去训练代码,那我一个大项目的完代码是完完整整会被上传?还是使用的单文件代码被上传,还是说部分代码片段被其他使用?
    如果大模型使用数据后,是作为模型原数据,会再次加工后使用,还是直接原始代码去匹配模型给其他人调用?
    可能我说的比较模糊,就是说我的私有代码(大面积)会有可能一模一样被其他人使用到?
    20 条回复    2025-12-17 13:15:11 +08:00
    NxxRngjnbgj
        1
    NxxRngjnbgj  
       4 小时 24 分钟前   6
    v 站用户向来以隐私强著称,但唯独在 ai 写代码这事情上,好像他们根本不在乎隐私,公司的代码随手就给了,不过也可以理解,又不是自己的东西,泄露了关我屁事,但是自己项目,他们也这样,另外最近有一个词叫 vibe coding ,可以说最近论坛非常 vibe 了,各种流水账产品,短时间内就给你写出来,然后分享到论坛,用他们的说法叫广撒网,看看有没有能火的,火了再考虑后续的运营,至于隐私是什么,那不重要。
    =============================================
    回到你的问题,你都把代码发人家了,你就剩一件事情可以考虑了,那就是因此带来的后果你能不能承受就行,想那么多干嘛。
    =============================================
    另外,curd 的代码,有很大价值吗,什么时候 ai 才能帮我写外挂啊
    kneo
        2
    kneo  
       4 小时 9 分钟前 via Android
    风险很大,但是被你发现的概率不大。无所谓的。
    cakera1ter
        3
    cakera1ter  
       4 小时 5 分钟前
    用别怕,怕别用,公司领导都不在乎,你管泄漏不泄漏
    corcre
        4
    corcre  
       3 小时 55 分钟前
    我一直在想有没有一种可能,公司不提供 AI 工具,但是打工人自己用,等领导想解雇你的时候只要拿到你使用 AI 的证据就能指控你违反了保密协议不需要给赔偿就能解雇员工
    M1234
        5
    M1234  
       3 小时 49 分钟前 via iPhone
    同有疑问,前两天看了 qoder 的隐私协议,免费版本明确写了会使用上下文代码做训练,就有点不敢在公司项目中用了。印象中 trae 也会,估计要隐私就要付费版本。
    Vaspike
        6
    Vaspike  
       3 小时 40 分钟前
    大多数项目的代码的价值要结合业务才能体现的, 或者说, 一个项目代码的保密性如果真的已达到断网或审查的程度, 公司 99%会规定项目内 AI 编程的红线或者工作电脑上 IT 管控

    总结下我的观点就是,很多项目只拿到代码并没什么关系的
    Goooooos
        7
    Goooooos  
       3 小时 38 分钟前
    安全排名:
    1. 自部署 AI
    2. AI 大厂的开发工具如 codex 、cc 、antigravity 等
    3. 使用量较大的开发工具/AI 大模型,如 cursor ,cc+glm ,cc+deepseek 等
    4. 一般大厂的开发工具或者是出名的中转站,如 trae ,kiro ,qoder ,openrouter
    5. 野鸡中转站
    zzxCNCZ
        8
    zzxCNCZ  
       3 小时 36 分钟前
    cursor 这种默认配置了忽略环境文件,但目前通过调用 cli 工具也可以查看内容
    ssssiiiirren
        9
    ssssiiiirren  
       3 小时 34 分钟前
    业务代码真的有什么价值吗?有价值的是业务本身。
    YanSeven
        10
    YanSeven  
       3 小时 21 分钟前
    有些朋友还是逻辑跳跃了。

    你泄露的代码有没有价值是一回事儿,AI 会不会泄露是另外一回事儿。

    我的主观判断就是,所有的 AI 都会泄露你的代码,这里的泄露是指用你的对话做训练。从国外三巨头到国内三巨头,我都如此坚信。
    ggzhyipeng
        11
    ggzhyipeng  
       3 小时 11 分钟前
    代码有没有价值是一回事儿,会不会对你进行追责是另一回事
    charles0
        12
    charles0  
       2 小时 58 分钟前 via iPhone
    你就当作会泄露吧,不想泄露数据的话可以本地部署(注:可以在云服务器上本地部署)
    charles0
        13
    charles0  
       2 小时 56 分钟前 via iPhone
    @NxxRngjnbgj 因为很多人并不把代码当作隐私,真正的隐私是日常消费记录、购买倾向、照片和文件、输入法词库等等
    hello267015
        14
    hello267015  
       2 小时 34 分钟前
    泄露代码 和 将代码用于模型训练是两回事

    ai 收集到的代码都是碎片化的,可能是几行,几个类文件,就算极端情况下要将整个项目库作为 context 发给 ai ,但到了 ai 模型算法内部,这些代码都转成了一些毫无业务意义的 tokens ,从原理上来说 ai 就没有完整泄露代码的机制....

    但是将代码用于模型训练几乎是每个 CodeAgent 都会做的事情吧,你会在意 AI 借鉴、学习你的代码么,在意的话就不建议用 AI , 我是不 care...
    sn0wdr1am
        15
    sn0wdr1am  
       2 小时 6 分钟前
    会有安全问题。

    如果公司有自己规定的,自己部署的 AI ,就用这个。
    如果公司有规定不能乱用 AI ,就不要用外面的 AI 。



    自己的代码,无所谓用什么 AI 。
    公司的代码,你不要任性,要尊重公司规定。
    changwei
        16
    changwei  
       1 小时 52 分钟前
    我也好奇过这个问题

    但是在使用 Copilot 时有看到他们官网说明: https://docs.github.com/en/copilot/reference/ai-models/model-hosting#openai-models

    比如 OpenAI 有写:OpenAI makes the following data commitment: We [OpenAI] *do not train models on customer business data*. Data processing follows OpenAI's enterprise privacy comments.

    他说不会用客户数据来 [训练模型] ,但是这句话的含义似乎并不代表他们不会收集数据来做其他用途?如果你是大公司的话,可以请教你们公司的律师和法务看看?!
    94
        17
    94  
       1 小时 32 分钟前
    @NxxRngjnbgj #1 ,这是数据安全,不是算是隐私问题。主要是使用 AI Coding 造成的合规隐患。

    ----
    作为回答就是会,自己很早期使用 Github Coiplot 的时候就完整补全出来了一段 juejin.cn 的文章链接出来……
    gongym
        18
    gongym  
       1 小时 2 分钟前
    @94 所谓的 ** juejin.cn 的文章链接 ** 应该是公开数据吧,不符合 OP 提到的场景
    94
        19
    94  
       16 分钟前
    @gongym #18 ,具体就不清楚了,完整 URL 复制出来又从 github 上面搜不到,就很奇怪。
    在写具体业务函数的 JSDoc 的时候突然补全出来一大堆文案里面就带了链接,我同事都快笑死了……
    connor123
        20
    connor123  
       5 分钟前
    一帮写业务代码的,为什么觉得业务代码是机密啊?
    你做的项目是火箭回收吗?

    在我看来,写业务代码的不需要操心是否泄密,把业务实现就行了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3855 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 38ms UTC 05:21 PVG 13:21 LAX 21:21 JFK 00:21
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86