最近做了一些图片比较以及文字识别的工作,现把用到的工具与模块总结一下,供大家参考。

1. PIL

PIL(Python Imaging Library Python,图像处理类库)提供了通用的图像处理功能,以及大量有用的基本图像操作,比如图像缩放、裁剪、旋转、颜色转换等。

安装

主要模块

http://effbot.org/imagingbook/pil-index.htm#tools-reference

2. ImageMagic

ImageMagick 是一个免费的创建、编辑、合成图片的软件。它可以读取、转换、写入多种格式的图片。图片切割、颜色替换、各种效果的应用,图片的旋转、组合,文本,直线,多边形,椭圆,曲线,附加到图片伸展旋转。也可做图片比较。

安装:

一些例子:
http://www.imagemagick.org/Usage/basics/#im_commands

Python 应用

ImageMagick 有 Python 封装的包,我在应用过程中觉得不太好用,所以就直接用下面的方式了

3. tesseract-ocr

Tesseract 的 OCR 引擎目前已作为开源项目发布在 Google Project,其项目主页在这里查看https://github.com/tesseract-ocr
它支持中文 OCR,并提供了一个命令行工具。python 中对应的包是 pytesseract. 通过这个工具我们可以识别图片上的文字。

安装:

Python 应用

关于训练自己的样本,请参考下面的链接,这块研究的不多
http://www.cnblogs.com/samlin/p/Tesseract-OCR.html

4. opencv

未完


↙↙↙阅读原文可查看相关链接,并与作者交流