
1 scnace 2016-07-24 10:09:17 +08:00 via Android 尝试一下 ocr |
2 int64ago 2016-07-24 10:11:05 +08:00 via Android 不需要 OCR ,这种是最简单的,过滤背景-分割-对比 |
3 jswh 2016-07-24 11:29:23 +08:00 |
4 niboy 2016-07-24 11:36:06 +08:00 PIL |
5 dotpig OP 发现有 PyTesser 可用。悲剧的是,我发现人民日版数字版其实要钱的,下了三页以后就要求输入订阅帐号了。那我只能上网学习人民日报了。 |
6 Garantion 2016-07-24 12:14:31 +08:00 最简单的 KNN 即可 Github 上一搜一大把 |
8 tscat 2016-07-24 12:17:56 +08:00 二值化之后 ocr 就行 |
9 klesh 2016-07-24 13:16:33 +08:00 会 python 不会编程? |
10 bazingaterry 2016-07-24 13:22:52 +08:00 via iPhone 这个和我校的教务系统很像,我处理的时候直接 OCR 就有 70% 成功率。 |
11 popok 2016-07-24 13:50:21 +08:00 |
12 popok 2016-07-24 14:04:59 +08:00 新建工程,然后每个数字都做一个字模,然后生成 cds 文件,用 python 调用一个 dll ,加载这个字模文件,就能识别了 |
13 coolzjy 2016-07-24 14:15:02 +08:00 这种类型的验证码,曾经用 Javascript 搞了一个在浏览器环境中识别的。 http://coolzjy.github.io/captcha-reader/ |
15 fusae 2016-07-24 16:12:15 +08:00 |
16 fusae 2016-07-24 16:13:46 +08:00 |
17 DaCong 2016-07-24 16:30:00 +08:00 我记得我曾经搞过一个类似的,好像是教务系统的。 说一下大致思路: 1. 图片降噪 2. OCR 识别 |
20 panda0 2016-07-25 08:36:24 +08:00 tesseract 我刚试了下,好像毫无难度。 |
21 dotpig OP 各位,看到大家的回复,很感谢。我在 5 楼说了,找到 PyTesser 了(基于 tesseract )。但是现在找到也没用,因为人民日报电子版需要订阅才能看。 |