Python pytesseract 的辨识度极低怎么办?

Heroman · 2021年10月15日 · 最后由 Heroman 回复于 2021年10月19日 · 4664 次阅读


百度一下四个字都识别不出来,识别成 [三] 三

共收到 10 条回复 时间 点赞

能贴一下识别的图么,一般正常字是没什么问题的,识别不了的话可以调调 pytesseract 的配置参数或者对图片做预处理 (二值化、降噪等等)
另外要看具体使用场景,看是否需要使用 OCR,有可能其他的方式也能做
另外还有其他 AI 开放平台的 api 可以用,识别中文应该比 pytesseract 更好一些

frankxii 回复


这个图片它识别是空

frankxii 回复

开放平台具体是指什么呢?我现在也是苦于找不到 API 去参考

Heroman 回复
  1. 上面的图片简单,识别不了多半是背景太花哨,用二值化就可以搞定。文字是接近纯白,用二值化可以把图片处理成背景纯黑,文字纯白的图片,可以参考下面的文章
    https://blog.csdn.net/bosszhao20190517/article/details/105837566

  2. 开放平台是指百度云、腾讯云等免费的 OCR 识别 api,一样的调接口,传入图片,然后识别结果,因为基于深度学习,数据集比 pytesserct 大,且是国内环境,中文支持更强,效果会更好一点

  3. 看你具体是要做什么操作,如果是找控件、点击之类的自动化操作,可以了解下模板匹配、airtest 之类的


我的可以啊

布吉岛 回复

您这里用的什么工具?可以使用在移动端 python 脚本中么?

frankxii 回复

二值化可以勉强使用了

可以试试 muggle-ocr

转用了更好使的百度 OCR

Heroman 关闭了讨论 10月19日 15:48
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册