通用技术请问下有人搞过提取图片里的文字吗?

ysir · 2024年10月09日 · 最后由 Ouroboros 回复于 2024年10月10日 · 10996 次阅读

识别率惨不忍睹，可能是特殊字体不容易识别。

目前的处理方法：opencv（灰度 + 高斯模糊去噪 + 二值法）+tessesact-OCR 识别。

但把同样的图片放到微信里识别，识别准确率很高。

是要针对字体做模型训练？有人相关的经验吗？

1 个赞

共收到 14 条回复时间点赞

今晚打老虎 #1 · 2024年10月09日

如果你是学，那当我没说，如果你是用，可以直接集成微信识别

5t5 #2 · 2024年10月09日

悲伤蛙 #3 · 2024年10月09日

百度飞浆有开源的离线包

干饭狂人 #4 · 2024年10月09日

百度飞浆试试呢？

墨妖 #5 · 2024年10月09日

如果你是仅仅是要使用 OCR，那么我建议你直接调腾讯 or 百度的 OCR 接口，每个月都有免费额度，拿你这个图片来看效果很好，如果你要研究 OCR 技术就当我没说。

rihkddd #6 · 2024年10月09日

ysir #7 · 2024年10月09日 Author

对

用，现在使用的阿里的接口，想试下自行实现效果的

尚酷米 #8 · 2024年10月09日

试试 trwebocr；直接 docker 部署，唯一缺点就是 cpu 慢

ysir #9 · 2024年10月09日 Author

对

5t5 回复

我 chatgpt 过，图片和文字本身很清晰
试过微信和阿里的，识别率比编写的代码高得多，不过有些文字也识别错误了。

ysir #10 · 2024年10月09日 Author

对

好，有时间我试试，据说里面可以对字体进行训练

ysir #11 · 2024年10月09日 Author

对

ysir #12 · 2024年10月09日 Author

对

现在用的阿里的接口识别率还还可以。

究客 #13 · 2024年10月09日

https://www.cnblogs.com/Im-Victor/p/17754051.html
中文支持最好的 6 款 OCR，推荐用前两种就可以，亲测好用

Ouroboros #14 · 2024年10月10日

除了 tesseract、PaddleOCR、EasyOCR 等，还可以直接调用 LLM~

需要登录后方可回复, 如果你还没有账号请点击这里注册。

通用技术 请问下有人 搞过 提取图片里的文字吗?