通用技术 请问下有人 搞过 提取图片里的文字吗?

ysir · 2024年10月09日 · 最后由 Ouroboros 回复于 2024年10月10日 · 4575 次阅读

识别率惨不忍睹, 可能是特殊字体不容易识别。

目前的处理方法:opencv(灰度 + 高斯模糊去噪 + 二值法)+tessesact-OCR 识别。

但把同样的图片放到微信里识别,识别准确率很高。

是要针对字体做模型训练?有人相关的经验吗?

共收到 14 条回复 时间 点赞

如果你是学,那当我没说,如果你是用,可以直接集成微信识别

百度飞浆有开源的离线包

百度飞浆试试呢?

如果你是仅仅是要使用 OCR,那么我建议你直接调腾讯 or 百度的 OCR 接口,每个月都有免费额度,拿你这个图片来看效果很好,如果你要研究 OCR 技术就当我没说。

ysir #7 · 2024年10月09日 Author

用,现在使用的阿里的接口,想试下自行实现效果的

试试 trwebocr;直接 docker 部署,唯一缺点就是 cpu 慢

ysir #9 · 2024年10月09日 Author
5t5 回复

我 chatgpt 过,图片和文字本身很清晰
试过微信和阿里的,识别率比编写的代码高得多,不过有些文字也识别错误了。

ysir #10 · 2024年10月09日 Author
悲伤蛙 回复

好,有时间我试试,据说里面可以对字体进行训练

ysir #11 · 2024年10月09日 Author
rihkddd 回复

ok

ysir #12 · 2024年10月09日 Author
墨妖 回复

现在用的阿里的接口识别率还还可以。

https://www.cnblogs.com/Im-Victor/p/17754051.html
中文支持最好的 6 款 OCR,推荐用前两种就可以,亲测好用

除了 tesseract、PaddleOCR、EasyOCR 等,还可以直接调用 LLM~

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册