[分享] 一个开源的基于 pipeline 的高性能 AI 推理框架 Modelbox - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
pymumu
V2EX    分享创造

[分享] 一个开源的基于 pipeline 的高性能 AI 推理框架 Modelbox

  •  
  •   pymumu 2022-11-10 19:23:25 +08:00 2192 次点击
    这是一个创建于 1135 天前的主题,其中的信息可能已经有所发展或是发生改变。

    地址: https://github.com/modelbox-ai/modelbox
    文档: https://modelbox-ai.com/modelbox-book/

    通过 UI 编排方式实现一个 REST-API Echo-Server 服务截图:
    mnist-flowchart alt rect_w_300

    ModelBox 解决的问题

    目前 AI 应用开发时,训练完成模型后,需要将多个模型和应用逻辑串联在一起组成 AI 应用,并上线发布成为服务或应用。在整个过程中,需要面临复杂的应用编程问题:

    问题 问题说明
    需要开发 AI 应用的周边功能 比如 AI 应用编译工程,应用初始化,配置管理接口,日志管理口,应用故障监控等功能。
    需要开发 AI 常见的前后处理 音视频加解码,图像转换处理,推理前处理,后处理 YOLO 等开发。
    需要开发和云服务对接的周边功能 比如 HTTP 服务开发,云存储,大数据服务,视频采集服务对接开发。
    需要开发出高性能的推理应用 需要基于多线程,内存池化,显存池化,多 GPU 加速卡,模型 batch 批处理,调用硬件卡的 API 等手段开发应用。
    需要开发验证 docker 镜像 需要开发 docker 镜像,集成必要的 ffmpeg ,opencv 软件,CUDA, MindSpore ,TensorFlow 等软件,并做集成测试验证。
    多种 AI 业务,需要共享代码,降低维护工作 需要复用不同组件的代码,包括 AI 前后处理代码,AI 应用管理代码,底层内存,线程管理代码等。
    模型开发者,验证模型功能比较复杂 模型开发者完成模型训练后,需要编写 python 代码验证,之后,再转成生产代码;在高性能,高可靠场景改造工作量大。

    ModelBox 的目标是解决 AI 开发者在开发 AI 应用时的编程复杂度,降低 AI 应用的开发难度,将复杂的数据处理,并发互斥,多设备协同,组件复用,数据通信,交由 ModelBox 处理。开发者主要聚焦业务逻辑本身,而不是软件细节。 在提高 AI 推理开发的效率同时,保证软件的性能,可靠性,安全性等属性。

    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2765 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 66ms UTC 02:42 PVG 10:42 LAX 18:42 JFK 21:42
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86