测试之家
Python
哪位大佬有好用的 pytesseract 简体中文字库,默认的不是很好用
Topics
QA
招聘
社区学堂
新
开源项目
活动
Wiki
Sign Up
Sign In
Python
哪位大佬有好用的 pytesseract 简体中文字库,默认的不是很好用
Heroman
·
October 18, 2021
· Last by
Heroman
replied at
October 19, 2021
· 3631 hits
默认的经过二值化之后很明显的两个字都识别不到
「All right reserved, any unauthorized reproduction or transfer is prohibitted」
共收到
3
条回复
时间
点赞
frankxii
#1
·
October 18, 2021
你把二值化后多余的背景剪掉再试试看能不能识别,有可能不是字库不好,而是背景太大,ocr 没有识别出对应的文字区域。先确定 pytesseract 能否识别你的样本再来思考后面的问题。
能否讲一下做 ocr 的目的是什么?识别控件,点击或者断言?通常很少有做全屏 OCR 的场景,有可能有其他更简单的方法达到你的目的。
异彩飞天
#2
·
October 19, 2021
不是应该在做二值化值钱就裁剪适当大小吗?你试试这个图在微信能否识别出文字。
Heroman
#3
·
October 19, 2021
Author
转用了 百度的 OCR,特别好使
Heroman
关闭了讨论
19 Oct 15:48
需要
Sign In
后方可回复, 如果你还没有账号请点击这里
Sign Up
。
Heroman
@Heroman
共收到
3
条回复
有新回复!
点击这里立即载入