
公司做的是美团业务,需要定期解析一批美团的订单截图(也有一些是手机相机拍的订单页面图片),提取出其中的订单号码。 我试用了下腾讯的 ocr 识别成功率很高,就是太贵了,图片量很大遭不住。哪位老哥研究过 OCR ,能不能推荐一个适合本地部署的,公司有 5060 显卡。
1 superhuai 9 days ago 偷偷摸摸用之前微信提取的那个 ocr , 应该不要钱。 |
2 Wao 9 days ago deepseek ocr |
3 Mogugugugu 9 days ago Paddle OCR 试试 |
4 66beta 9 days ago 听上去 Gemini 本地模型 Gemma 4 就能做?而且显卡错错有余 |
5 Leon6868 9 days ago 也许用多模态大模型比普通 OCR 好,收集拍摄的订单图片对于基于文字分隔的 OCR 而言还是太难了 |
6 raptor 9 days ago @Mogugugugu 百度这个确实还行 |
7 diudiuu 9 days ago gemma+ocr 一套 https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF/tree/main mmproj-BF16.gguf 这个是图片模型 |
8 honda720 9 days ago Paddle OCR 就是干这个的,5060 应该能搞个稍微好点的 |
9 xyooyx 9 days ago Topdu/OpenOCR 前段时期试了个小型的,效果不错 |
10 defunct9 9 days ago mmproj-BF16.gguf 这个是多模态用的,https://rendoumi.com/posts/20260409-gemma4_install/ |
11 wnpllrzodiac 9 days ago rapid OCR |
12 cheng6563 9 days ago 跑个 qwen 看效果怎样。 |
13 labubu 9 days ago 百度 Paddle server 版本 |
14 iorilu 9 days ago 关注下, 模型太多了 现在有什么排行榜或确认的评测, 那几个模型领先吗 |
15 TuringGooner 9 days ago 之前不是有大佬逆向出来一个微信的 OCR 组件,纯算法的 |
16 Seanfuck 9 days ago Paddle OCR 基本上最强,有 cpu 版本,有现成的容器镜像。 |
17 picone 9 days ago paddle OCR ,性能也不错 |
18 BlueSkyXN 9 days ago 我一般用 MAC 自带的 |
19 pandaPapa 9 days ago deepseek ocr 好像免费的 |
20 SmallBlueZhao 9 days ago |
21 whitewatercn 9 days ago 之前试过,paddle-ocr-vl1.5 足够好用,且开销不大,跟着这两个教程玩就足够了 先部署 https://forum.beginner.center/t/topic/2677 再调用 https://forum.beginner.center/t/topic/2681 |
22 whitewatercn 9 days ago @SmallBlueZhao #20 有一说一百度在 ocr 方面的积淀很深,不知道多少年前就开始提供 ocr api 了,大模型出来以前,他们的 api 就很好用 |
23 tianjiyao 9 days ago @SmallBlueZhao 这个你别说 paddle OCR 是这个 行业的翘首。。。百度这个是真的不错。更加厌恶肉饼了。。。。。 多好的牌。。打成这样子稀烂 |
24 ShawnShi PRO https://aistudio.baidu.com/paddleocr 提供免费服务 效果不错的 |
25 mashimaroinfo1 9 days ago |
26 Les1ie 9 days ago 直接用 paddleocr ,或者用基于他而开的框架 rapidOCR 。开发和部署都超级简单,不吃资源,比如我上个月搓的简易验证码识别,简单粗暴又高效 https://github.com/IanSmith123/easy_captcha :) |
27 livelyyongheng1 9 days ago 那必然是 paddle |
28 NizumaEiji 9 days ago paddle ocr 吧 日常用比较稳 没必要上多模态的 llm 吧 |
29 AiBoy 9 days ago 识别中文手写最强的是谁呢? |
30 superPONY 9 days ago 巧了,最近在做的项目刚好测了几个多模态/OCR 模型,你可以参考我的项目 readme 文档,https://github.com/RAGDock/RAGDock 。有用的的话求个 Star 哈哈哈 |
31 andlp 9 days ago yolo 效果比大模型好 定位订单的区域,针对这个字体识别,然后只识别 0-9 这 10 个数字 效果比什么大模型都要好的多 |
32 berry10086 9 days ago easyocr 也可以 |
33 miaomiao888 9 days ago @AiBoy 合合 OCR |
34 SanjinGG 8 days ago rapidocr |
35 Selenium39 8 days ago llmocr |
37 JoeSmith 8 days ago |
38 fork3rt 8 days ago Paddle OCR VL 即可 |
39 ukoudai 8 days ago 你直接使用 macos,自带 视觉识别的 ,速度还贼快 |
40 lyhiving 8 days ago 识别中文手写最强的是谁呢? |
42 fenildf 8 days ago @whitewatercn 这种在 windows 下有法部署吗? |
43 fenildf 8 days ago @superPONY 已 star 。看起来挺好。想自己试试,发现缺指导文件 BUILD_GUIDE.md |
44 EchoPrince OP @berry10086 今天简单试了下,手机截图准确率很高了,但是相机拍摄的照片有时候订单号中间会缺失 3-4 位数字 |
45 fenildf 7 days ago @EchoPrince 相机应该分辨率更高吧。不过可能被环境影响了 |
46 whitewatercn 5 days ago @fenildf #42 windows 没试过,但是最简单的就是上 docker 吧,只要能启动 paddleocr 就行 |
47 fenildf 2 days ago @whitewatercn 好的,谢谢 |