Look 是一款基于 CNN 训练的验证码识别工具,提供切图、训练、测试、识别等方法,优点是样本需求少,运行速度快,使用超级简单。
项目地址: https://github.com/tonglei100/look/tree/master/look
QQ 交流群:158755338 (验证码:python)
扫描公众号及QQ 群二维码加入我们
访问 https://pytorch.org/get-started/locally/
找到适合自己的安装方式,如 Windows 上 Python3.6 的安装方式:
# Python 3.6
pip3 install http://download.pytorch.org/whl/cpu/torch-0.4.1-cp36-cp36m-win_amd64.whl
pip3 install torchvision
pip install look
pip install -U look
在合适的目录,如 D:\ 目录下,打开 CMD 命令行窗口,输入如下命令
look
cd look_example
python start.py
收集验证码图片样本集,放在 原始训练图集 目录。
需要把验证码图片手工命名,格式:验证码_时间戳,比如验证码图片上字符为 U6k4,则命名为 U6k4_1234567890.png。
如果验证码上字符有大小写,而实际输入不区分大小写,则可以全部命名为大写字母 (建议做法)。
验证码的字符集需要和 setting.py 中定义的一致,请根据需要修改。
切图方法如下,详细说明见示例代码说明
cut_train()
训练方法如下,详细说明见示例代码说明
train('model.pkl')
和 1. 收集训练 类似。(其实,也可以从训练图集剪切一部分到测试图集中)
和 2. 训练 类似。
识别方法如下,详细说明见示例代码说明
code = recognize('model.pkl')
本项目是基于开源项目 pytorch-captcha-recognition,主要做了以下功能优化:
最后,感谢 Dee Qiu (dee1024) 的贡献。