求助,各位有没有使用过 PaddleOCR 的 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
v2306
0.11D
V2EX    问与答

求助,各位有没有使用过 PaddleOCR 的

  •  
  •   v2306 1 天前 792 次点击

    原图长这样,

    识别后结果:

    Docekr 部署的 PaddleOCR-VL

    问题就是列错位了,个别情况单位还识别不出来,官网的 API 也是这样,试了一下官网三个模型,就 VL 感觉还行

    Windows 开发用过 PP-StructureV3 ,对数字的识别不太友好

    除了拿到结果进行后处理,还有没有其他方法,让模型更加准确一点

    AI 也给不出实质性的回答,只能来碰碰运气了

    21 条回复    2026-01-01 14:44:52 +08:00
    gyang1111
        1
    gyang1111  
       1 天前
    我 ocr 是直接 tg bot 部署到 cf worker 上调用 gemini api ,ai studio 的 key 有免费额度,偶尔用用效果还不错。。
    SanjinGG
        2
    SanjinGG  
       1 天前
    你要用别人封装的效果好点,PaddleOCR 自身很重,效果也一般,需要调教
    fizzzzz
        3
    fizzzzz  
       1 天前   1
    前段时间处理过类似的,表格我用的 PP-StructureV3 ,然后让 ai 用 python 写了一个根据坐标还原结构的处理。自己利用坐标结构还原表格,不依赖 ocr 的结果。
    fizzzzz
        4
    fizzzzz  
       1 天前
    @fizzzzz 我这个是识别后处理的办法,当时也是没找到提高模型的办法,在 查看 issue 和 ai 聊天了解到微调并不一定是正反馈有可能越微调效果越差了
    fizzzzz
        5
    fizzzzz  
       1 天前   1
    @fizzzzz #4 再推荐一个 mineru ocr 你也可以试试效果
    v2306
        6
    v2306  
    OP
       1 天前
    @fizzzzz #3 感谢提供思路
    v2306
        7
    v2306  
    OP
       1 天前
    @SanjinGG 相当重了
    donaldturinglee
        8
    donaldturinglee  
       1 天前
    如果没有经费调用 API ,那就自己做标注训练
    tboy
        9
    tboy  
       1 天前   1
    给你个思路按列切割在识别
    TheGreatSage
        10
    TheGreatSage  
       1 天前
    用过,做购物小票识别,准确率一半一半吧,很考验拍照的角度
    cryptovae
        11
    cryptovae  
       span class="ago" title="2025-12-31 17:06:16 +08:00">1 天前   1
    lululau
        12
    lululau  
       23 小时 54 分钟前   1
    yaleyu
        13
    yaleyu  
       23 小时 29 分钟前   1
    最近发现一个识别率挺高的 OCR ,https://github.com/datalab-to/surya, 识别你的图片如下
    supermama
        14
    supermama  
       23 小时 13 分钟前
    用了好几年,一直是自己二次训练。稳定性还不错。
    v2306
        15
    v2306  
    OP
       23 小时 1 分钟前
    @yaleyu #13 可以啊
    v2306
        16
    v2306  
    OP
       23 小时 0 分钟前
    @supermama #14 老哥怎么二次训练啊,没搞过
    yaleyu
        17
    yaleyu  
       22 小时 56 分钟前
    @v2306 #15 我也是前段时间有识别表格的需求,发现 PP- Structure 老是错位,还有要识别带音乐符号的字幕,PP-OCR 识别不了音乐符号,找到这个的,不过这个超级慢。
    v2306
        18
    v2306  
    OP
       22 小时 46 分钟前
    @yaleyu #17 一模一样哈,PP-structure 真的不好用,识别我那张图数量和单价数值都是连在一起的。这个 VL 也慢
    mengyx
        19
    mengyx  
       16 小时 40 分钟前 via iPhone
    immich 的 OCR 用的就是这个,感觉效果还不错
    supermama
        20
    supermama  
       7 小时 6 分钟前
    @v2306 你可以看下 paddle 官网,官网有文档教怎么做的。
    Censhuang
        21
    Censhuang  
       2 小时 59 分钟前
    效果就是差,建议从百度云上调用,不过百度云应该是没有说云上部署的是开源 paddle
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2365 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 09:44 PVG 17:44 LAX 01:44 JFK 04:44
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86