
已更新支持手机浏览器进行ocr,并优化大PDF处理过程
1 justincnn 2023 年 6 月 12 日 准确率很高,支持 pdf 转 excel 么? |
3 EmpCold 2023 年 6 月 12 日 |
5 itxh 2023 年 6 月 12 日 已收录到 https://www.wangdu.site/software/566.html ,希望对你有所帮助 |
8 kebamt 2023 年 6 月 12 日 稍微复杂的就处理不了,而且太慢了 |
10 itechify PRO 支持直接粘贴吗? |
11 itechify PRO @oneisall8955 不好意思,没看到下面的小技巧 |
12 fox 2023 年 6 月 12 日 支持一下,蛮好 |
13 vueli 2023 年 6 月 13 日 我记得之前有个事情,说什么 orc 的问题坐牢的。具体什么东西我忘记了,楼主留个心眼 |
16 b4115Z4mRAz9P8EA 2023 年 6 月 13 日 非常好,请教一下,ocr 有办法识别相应文字的字体、字体大小、粗细、颜色这些信息吗? |
17 subframe75361 2023 年 6 月 13 日 可以支持一下 pwa 吗 |
18 subframe75361 2023 年 6 月 13 日 非常好用 |
20 dassh OP @subframe75361 感谢支持,近期可能不会弄 pwa ,因为不太懂这块,目前的最优先的是使用多 worker 加速识别速度、尝试支持手机浏览器,后续弄完我学学看。 |
21 getcodex 2023 年 6 月 13 日 如果要支持表格提取识别,可以弄吗 |
22 fakecoder 2023 年 6 月 13 日 优秀! |
24 b4115Z4mRAz9P8EA 2023 年 6 月 13 日 @dassh 没关系,我也一直没找到 |
26 hteen 2023 年 6 月 13 日 |
28 RatioPattern 2023 年 6 月 13 日 英文效果很好,比 python-docr 和 tesseract 默认都好多了 |
29 RatioPattern 2023 年 6 月 13 日 没有做任何微调达到的效果吗 |
30 dassh OP @RatioPattern 是的 |
31 jzyzcz 2023 年 6 月 14 日 速度很快!后面会推出收费模式吗? |
32 dassh OP @jzyzcz 关于收费: 短期不考虑,一是做 ocr 的网站太多,又没什么杀手级功能,二是接入支付挺麻烦(没做过),三是用户量没几个,收费都跑了。一开始想法是接入 adsense 看能收回服务器成本不,但 adsense 不给新站过,先等等 关于速度: 目前都是单线程预测的,计划增加配置使用多线程预测,配置越多,速度越快,当然你 cpu 和内存也占用越多 近期规划: 1. 网站是 23 年 5 月 21 日上线的,google search console 配置了,但 ocr 网站太多,搜索 online ocr 前 8 页都找不到(没有第 9 页,只有 8 页),我有在后台统计 ocr 的图片数量、pdf 页数(也仅限于此),在 v2 发这贴之前,这个数字基本每天都是 0 ,所以我得学学怎么宣传,seo ,做外链这些 2. 上面提到的速度优化 3. 注意到有人尝试了 ocr 一个几百页的 pdf ,一本书?我也试了下,直接快卡死一段时间,后面在预测第二页时崩了,分析了下当前是用同步的方法将所有图片加载到内存,所以一次性加载几百张图片撑不住,不知道这个是不是强需求,我会尝试解决 |
33 kangyangqishi 2023 年 6 月 14 日 |
34 LavaC 2023 年 6 月 14 日 好奇问一下 op ,如果想做一个适配异型字体(异型到看不出是什么)的 ocr 工具,也可以应用你这套开发流程吗? 只需要识别 26 个英文字母就好了。 |
35 dassh OP @LavaC 可以的,“异型到看不出是原字母”的话,就需要单独训练一个识别模型,只有 26 个字母的话大概 10k 的训练样本吧(经验之谈)。 然后针对你说的:“我这套开发流程”,可能并不适用,因为这个网站是针对通用 web 场景的,然后为了省服务器成本,把预测步骤放到了端侧,开发时间全耗在这里面( onnx ,web worker, opencvjs )。你可能更需要的是只是一个 restful 接口,有基础的可以看看 PaddleOCR 文档 |
37 92Developer 2023 年 9 月 19 日 via Android |
38 lynzya 2025 年 4 月 1 日 |