DPDK 如何学习才能就职相应的岗位 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
allegory
V2EX    程序员

DPDK 如何学习才能就职相应的岗位

  allegory 2024-12-11 21:10:33 +08:00 2287 次点击
这是一个创建于 370 天前的主题,其中的信息可能已经有所发展或是发生改变。

本人 25 届毕业生,主语言 C++, 想从事网络开发相关工作。

目前的想法是毕业前这几个月啃一啃 DPDK, 写点项目。奈何 B 站搜出来的视频教程 98%都是出自某机构引流卖课的, YouTube 上则更少,阅读官方文档的话周期长不说,还容易找不到重点,得不到及时的练习。

各位前辈 你们是怎么学习/掌握它的,能否在此帖中分享一些经验、资料?(引流卖课勿扰~ 谢谢

我想知道/获得的信息:

  1. 如何学习(路线、重点)
  2. 适合练手和写在简历上找工作的项目
  3. 资料(书籍、博客、视频都可)
  4. 其他学习建议

不胜感激~

25 条回复    2025-12-12 01:00:40 +08:00
AFOX
    1
AFOX  
   2024-12-11 21:12:24 +08:00
这种是不是只有去企业实习才能入门?不然找找 mit 的公开课吧
datou
    2
datou  
   2024-12-11 21:18:29 +08:00
看成 DPRK
FlashEcho
    3
FlashEcho  
   2024-12-11 21:30:55 +08:00
没有建议,单纯分享下经历:

我也是用 c++技术栈面的后端,多学了点网络,把 webserver ( io_uring 版)写完就深入看了点 DPDK ,不得不说资料是真的少,比较长的就一个零声教育的

不过面试写这种其实不是特别讨好,因为做业务的面试官不懂这个,不会多问,懂的面试官又很容易非常懂,会用刁钻的角度拷打你,除非你确实是在大厂的鸡架组实习过,自学这些偏底层的技术还是太难了
allegory
    4
allegory  
OP
   2024-12-11 21:32:23 +08:00
@datou 想吃广东菜了你是[doge]
hiplon
    5
hiplon  
   2024-12-11 21:34:26 +08:00
曾经通信核心网设备上云用过一段时间
RangerWolf
    6
RangerWolf  
   2024-12-11 21:35:39 +08:00
@allegory DPRK 跟广东菜有什么关系? 这是什么梗
FlashEcho
    7
FlashEcho  
   2024-12-11 21:38:18 +08:00   1
@RangerWolf #6 有一个 bgm 经常作为朝鲜视频的配乐,有一句歌词听起来很想“想吃广东菜”,你可以去 b 站搜关键词“想吃广东菜”
carmark
    8
carmark  
   2024-12-11 21:52:42 +08:00
建议找个实习搞 RDMA ,这个可能方向性上面更好,AI 强依赖这个。

无论从需求到场景都会更多。
allegory
    9
allegory  
OP
   2024-12-11 22:31:20 +08:00
@carmark 搞 RDMA 的岗有哪些啊,能不能列举一些,岗位或单位
carmark
    10
carmark  
   2024-12-11 22:45:13 +08:00
@allegory BOSS 搜一下呢?这个主要是搞 RoCE 拥塞控制,各种监控,各种识别,然后与 nccl 协同。

当然还有比如新华三这种做 RoCE 协议开发的。
FabricPath
    11
FabricPath  
   2024-12-12 10:46:26 +08:00   5
DPDK 和 RDMA 都不建议,建议远离网络。
对于 DPDK:
1. DPDK 太成熟了,成熟到每个会用 DPDK 的公司都一堆 DPDK 的开发
2. DPDK 大部分场景都是和虚拟机、L4LB 、NAT 相关,这些场景都有低性能的现成的替代品,DPDK 只适合对性能有要求的场景(比如 L4LB ,小规模场景 ipvs 跑个几十 Gbps 妥妥没问题)
3. 随着容器化推进,随着虚拟机场景的收缩,DPDK 会集中在 L4LB 之类的集中式网关场景,容器化场景无法使用 DPDK (浪费 CPU 、相比 ebpf 没有带来性能优势、ebpf 吊打 vduse 这种强行在容器场景上 dpdk 的方案)

对于 RDMA:
1. 纯硬件实现,你在其中能做的事情不多,大量的时间会用在性能测试、拥塞控制测试、监控开发、配置脚本开发
2. RDMA 中短期场景有限,对于小公司来说,只有 AI 和存储场景有优势;在 rpc 场景是负向收益(或者说收益是否值得全网采购 mellanox 的网卡);在低于 100Gbps 的带宽下 RDMA 相比 tcp 没有优势( rdma 延迟稍微低一点,但是你真的需要低这几 us 的延迟?)
3. rdma 领域,mellanox 一家独大,mellanox 在 20 年前开始搞 infiniband ,被以太网压了 20 几年,这两年终于出头了,那不大赚特赚一波;再加上 nvidia 收购 mellanox 之后 GPU+网卡的强绑定,导致 RoCE 生态被 mellanox 独占
4. 最近几年 mellanox 吹他的 ProgrammableCC ,但是真的用 PCC 的公司屈指可数,DCQCN 能满足 99%的场景
5. RDMA 的应用层开发如上所说,AI 和存储场景有优势,但是存储领域,现在 kernel 的 nvme-of 很成熟,SPDK 也很成熟; AI 领域,NCCL 虽然 bug 很多,但是也能用,而且一般公司也不会选择去大规模修改 NCCL


你还想听我能给你扯一堆理由,简单学学可以,要变现很难;当成兴趣爱好学习一下没啥问题。
RDMA 和 DPDK 都可以闲鱼买 mellanox cx4 (几十块钱)、cx5 (几百块钱)来入门
kuanat
    12
kuanat  
   2024-12-12 13:33:23 +08:00
楼上看 id 就知道靠谱。

网络这个领域一定要先有市场需求才有岗位需求,由于相关技术往往和硬件以及架构强绑定,离开了这个环境这些技术就没有用武之地了。

如果你真的想学,DPDK 建议往 ebpf 方向走,RDMA 往分布式存储方向走。
lzZzeucJri6FcR0o
    13
lzZzeucJri6FcR0o  
   2024-12-12 13:56:16 +08:00
@FabricPath #11 是的,现在分布式全闪都是用的这些技术,但是门槛也比较高,打铁还得自身硬,虽然前景一片蓝海,但是国内市场并不明朗,全闪太贵了
dododada
    14
dododada  
   2024-12-12 14:10:10 +08:00
硬件领域不了解,唯一接触过 dpdk 的工作就是流量镜像分析,根本不懂
allegory
    15
allegory  
OP
   2024-12-12 21:54:07 +08:00
@FabricPath 感谢老哥,像我这种小白就是容易过多关注技术本身,忽略最重要的市场。看了你的回复决定换别的方向。(老哥有建议/推荐的吗)
FabricPath
    16
FabricPath  
   363 天前
@allegory 追热点去搞 AI 吧,infra 最近两年没啥新活了
jackgoudan
    17
jackgoudan  
   18 天前
@FabricPath 大佬请问下,我原先主要的工作职责是 k8s 那套为主,换了一份工作去做 ml infra ,现在组里 rdma 懂得人不太多,从投入产出来说,您认为深入搞下 rdma 有意义吗?
FabricPath
    18
FabricPath  
   18 天前
@jackgoudan "深入"

需要看你的公司,如果你是头部公司,和 mellanox/nvidia 有周会或者月会的话,深入搞 RDMA 有意义;
如果你工作的时候,没有任何和 mellanox/nvidia 的人有交流,那你不太能深入搞 RDMA ,RDMA 是网卡硬件实现的,一堆的黑盒逻辑,nvidia 的开发都不一定能说的清你遇到的问题

如果你是做信创产业的,并且有固定的合作的网卡厂家(国内挺多搞 RDMA 网卡的,不过缺陷比较多),那一样能“深入”搞 RDMA ,并且由于你平时遇到的问题实在是太多了,大概率比用 nvidia 的网卡会更深入了解 RDMA ;缺陷就是技术栈不复用,因为 nvidia 的 nvl72 开始,就几乎是强制使用 infiniband 了,“你可以用 RoCE ,但是我们技术支持力度肯定不如用 ib”,但国内的 RDMA 网卡都是 RoCE 。

所以你评估一下你是否真的能深入搞 RDMA ,如果能,那么这个行业虽然很窄,但是前景广阔,未来属于高速网络;
如果你不满足上述的环境,那大概率就是搞搞 RDMA 的监控、测试一下 RDMA 的配置了,玩熟练了就跑路吧
jackgoudan
    19
jackgoudan  
   18 天前
@FabricPath 明白 单位平台还行,卡也不少。 不过还没到-如果你是头部公司,和 mellanox/nvidia 有周会或者月会,这类公司是公有云这种吗?

另外结合你的描述,我降低目标,玩熟练 RDMA 那套东西就好 。十分感谢
FabricPath
    20
FabricPath  
   18 天前
@jackgoudan 不一定是公有云,nvidia 的大客户就行,或者说你有问题能找到 nvidia 的人给你对接就行。这个领域基本上没有开放的知识,即使 nvidia 给的文档,也是用 partners.nvidia.com 分发的,而且文档都带水印,所以网络上基本没有开放的文档
jackgoudan
    21
jackgoudan  
   17 天前
@FabricPath 哈哈,那我明白了。 工作里对 nv 的人接触仅有几次来公司的技术分享哈哈 ,算不上 partner 。多问一嘴,大佬是在哪儿上班啊? id 也是属实 rdma 老兵了 哈哈
LinYaXuan
    22
LinYaXuan  
   5 天前 via iPhone
@FabricPath 大佬,不太懂这个领域但是校招拿个大厂 rdma 相关方向的鸡架 offer ,还有个普通后端,薪资差不多,强度鸡架低,建议入坑吗?
FabricPath
    23
FabricPath  
   5 天前   1
@LinYaXuan 看公司,只要是主流的、认真的、大规模的搞 rdma 的公司,都值得去,比如字节、阿里、腾讯; RDMA 走的多深入和你团队的业务是强相关的,如果就几百卡的规模,那没啥好玩的,大概率做做监控;上到万卡可以去

普通后端是有多普通,看你业务前景,后端的技术深度远小于 rdma ,普通的 curd boy 极大概率被 ai 替代;
LinYaXuan
    24
LinYaXuan  
   5 天前 via iPhone
@FabricPath 感谢大佬。是阿里和小红书的社区工程、用户增长相关后端。
t/1178142
FabricPath
    25
FabricPath  
   5 天前   1
@LinYaXuan 那无脑选阿里。
小红书这个,看上去体量和前景都不是很大。做后端最大的问题,你的“产出”难以量化,当产出难以量化的时候,很容易出现绩效不符合你预期。
放到 RDMA 领域,你可以直接量化“带宽利用率从 80%提升到了 85%,训练速度提升了 N%”再结合规模和年成本,能直接映射到“用同样的钱,做了更多的事情“上
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5531 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 26ms UTC 02:41 PVG 10:41 LAX 18:41 JFK 21:41
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86