本地 GPU 虚拟化怎么做? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
请不要在回答技术问题时复制粘贴 AI 生成的内容
495414572

本地 GPU 虚拟化怎么做?

  •  
  •   495414572 Aug 1, 2023 3361 views
    This topic created in 1013 days ago, the information mentioned may be changed or developed.

    各位 V 友,小弟不才。公司最近想搞一堆显卡,想问一下有没有 V 友知道业界怎么做本地 GPU 虚拟化的,了解到阿里有 cGPU 技术。另外了解到之江实验室也有很多的本地卡,如果不是对外出售云服务,只是对内各部门使用,需要做 GPU 的虚拟化吗? https://www.nvidia.cn/data-center/graphics-cards-for-virtualization/ https://blog.csdn.net/HaoZiHuang/article/details/126972625

    16 replies    2023-08-03 15:46:27 +08:00
    leixx
        1
    leixx  
       Aug 1, 2023
    mark ,最近公司也在开展 GPU 的项目,学习一下
    zyqv2
        2
    zyqv2  
       Aug 1, 2023 via iPhone
    NVIDIA 的 grid 驱动,vgpu license 收费;或者 kvm 的 virgl ,有性能损耗
    ysc3839
        3
    ysc3839  
       Aug 1, 2023 via Android
    内部使用的话 Docker 就行了吧,虚拟机的 GPU 虚拟化好像都要收费的
    leixx
        4
    leixx  
       Aug 1, 2023
    我们是有两个大佬,一个大佬搞内核,一个大佬搞 k8s GPU 调度,我猜想虚拟化也是底层有一套接口?然后通过 hook 的方式,接过来,走自己的逻辑? 不过虚拟化收益高吗?一般直接跑满了。
    defunct9
        5
    defunct9  
       Aug 1, 2023
    kvm
    zzz22333
        6
    zzz22333  
       Aug 1, 2023
    virtio-gpu 是一种方案,公司同事最近也在搞
    Yiukam
        7
    Yiukam  
       Aug 1, 2023   1
    需求不大,K8S/Docker 就好了,某地方能源集和下的券企就是玩的。玩 LLM 的,推理所,就是例多卡或者裸就好了。效率相差不大。

    我自己部也是裸+Docker 的合。
    kobe718
        8
    kobe718  
       Aug 1, 2023
    gpu 虚拟化需要 gpu 硬件支持 sriov
    以前 nvidia 有专门用于虚拟化的显卡叫 grid 系列,可以根据不同的 profile 来把一块高端卡分成好几块低端卡来
    但是普通的民用卡、计算卡都没有开放 sr-iov 接口
    amd 的好像有见说开放
    但没具体研究过
    cczh678
        9
    cczh678  
       Aug 1, 2023
    大哥应该是为公司的实际立项的项目来做方案的选型吧?有一家做虚拟化 GPU 的公司,趋动科技,可以了解下他们的产品,我们双方是合作关系。
    4179e1
        10
    4179e1  
       Aug 1, 2023
    v2gba
        11
    v2gba  
       Aug 1, 2023
    @defunct9

    我以为你要说 “开 ssh ,让我上去看看”
    495414572
        12
    495414572  
    OP
       Aug 1, 2023
    谢谢巨佬们指路,虽然我感觉这个 GPU 虚拟化的需求不一定大,小弟先去研究一下
    kennylam777
        13
    kennylam777  
       Aug 1, 2023 via Android
    不分限的,用 k8s 分配 gpu 源已足,不必像 cloud 弄成 multi tenants 的,RTX 一家用品也有化的限制
    https://github.com/NVIDIA/k8s-device-plugin
    stoneabc
        15
    stoneabc  
       Aug 1, 2023   4
    有几种:
    1. NVIDIA 官方:VGPU ,这个最趋向于用户理想的虚拟化,一个 GPU 虚拟出多个 vgpu ,通给不同的虚拟机,呈现的和真实 GPU 没啥差异,图形渲染+通用计算都支持。缺点是 license 要钱。
    2. 还是 NVIDIA 官方:MIG ,现在应该只有 A100/H100/A30 支持,物理上的切分,缺点是能切分的规格很有限,只支持通用计算。
    3. 各类第三方厂商的 hook 类型“虚拟化”:阿里 cGPU ,腾讯 qGPU ,驱动等等,都是 hook GPU 驱动,再基于容器做切分,只支持通用计算,原理有点类似 vGPU ,好处是不用钱,切分非常灵活。

    不想搞云上的,那就用 NVIDIA 官方方案,或者像趋动这种三方厂商,不建议自己折腾。
    FelixChenddd
        16
    FelixChenddd  
       Aug 3, 2023
    什么卡,图形卡还是计算卡
    About     Help     Advertise     Blog     API     FAQ     Solana     2946 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 65ms UTC 09:59 PVG 17:59 LAX 02:59 JFK 05:59
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86