如何本地部署 DeepSeek-r1 模型训练自己的大模型 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
CodingNameless
V2EX    Local LLM

如何本地部署 DeepSeek-r1 模型训练自己的大模型

  •  
  •   CodingNameless 315 天前 5134 次点击
    这是一个创建于 315 天前的主题,其中的信息可能已经有所发展或是发生改变。

    关于本地部署 DeepSeek-r1 模型进行定制化训练的问题,想请教一些技术细节。我们公司计划开发一套智能问答系统,主要用于内部业务指南的自动化处理。考虑到数据安全性和定制化需求,我们希望在本地环境部署 DeepSeek-r1 模型。

    通过向模型提供高质量的领域特定数据,是否能够有效训练出符合公司业务需求的定制化模型? 在训练过程中所使用的技术是什么? 我们计划使用公司积累的高质量业务文档和知识库作为训练数据,期望最终模型能够准确理解和回答与公司业务相关的问题。

    感谢各位大佬的宝贵时间和建议!

    13 条回复    2025-02-13 11:50:57 +08:00
    Kite6
        1
    Kite6  
       315 天前 via Android
    671b ,成本爆炸
    CodingNameless
        2
    CodingNameless  
    OP
       315 天前
    不会用到 671b ,只是 14b 或者 32b 这种能回答一些基本问题的,然后也能结合我们公司的业务知识
    CodingNameless
        3
    CodingNameless  
    OP
       315 天前
    @Kite6 #1 不会用到 671b ,只是 14b 或者 32b 这种能回答一些基本问题的,然后也能结合我们公司的业务知识
    qxmqh
        4
    qxmqh  
       315 天前   1
    你去 github 上搜一个叫 LLaMA-Factory 的东西。你会发现有惊喜。
    Mianmiss
        5
    Mianmiss  
       315 天前   1
    推荐你用 DIFY 建立公司知识库,微调就算有框架,没点技术 也很难训练成。
    Dw521
        6
    Dw521  
       315 天前
    ollama 搜索一下这个也会有惊喜
    visper
        7
    visper  
       315 天前
    直接 ollama 一个命令...
    newaccount
        8
    newaccount  
       315 天前
    14b 和 32b 就是被 deepseek-r1 提拔了两句的阿里通义千问,它跟 deepseek 的关系就是没啥关系
    heliar
        9
    heliar  
       315 天前
    先别一开始就想着训练,用 RAG 试试。训练的话你知识库经常更新成本不低
    JohnYehyo
        10
    JohnYehyo  
       315 天前
    AI 初阶玩家好奇问一下, 如果微调的是 deepseek 蒸馏过的模型比如 OP 提到的 DeepSeek-R1-Distill-Qwen-14B, 那么
    1.会不会让模型反而表现不佳
    2. 和我直接微调蒸馏对应的 Base Model(比如 Qwen2.5-14B)区别大吗
    specssss
        11
    specssss  
       313 天前
    直接去优云智算,有基于 vLLM 、Ollama 的 R1 蒸馏模型,基于 Unsloth 的动态量化版本,比较全了
    https://www.compshare.cn/image-community
    tycholiu
        12
    tycholiu  
       311 天前
    可以直接用这家 https://ppinfra.com ,API 服务在国内做得已经很不错了,推荐使用,
    isSamle
        13
    isSamle  
       308 天前
    @visper @Dw521 ollama 可以微调?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2875 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 36ms UTC 14:02 PVG 22:02 LAX 06:02 JFK 09:02
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86