Break Captcha

项目介绍

验证码识别 - 该项目是基于 CNN5/ResNet+BiLSTM/BiGRU+CTC 来实现验证码识别。

注意事项

如何使用CPU训练：

本项目默认安装TensorFlow-GPU版，建议使用GPU进行训练，如需换用CPU训练请替换 requirements.txt 文件中的tensorflow-gpu==2.0.0b1 为tensorflow==2.0.0b1，其他无需改动。需要注意的是，本项目只在tensorflow-gpu 2.0b1下经过完整测试，由于tf2当前还处于测试阶段，每个版本都有一些变更，比如目前tensorflow-gpu 2.0rc0 以及rc1 需要修改源码中tensorflow的导入方式，详情阅读tensorflow 升级文档和issues.
关于BiLSTM/BiGRU网络:

保证CNN得到的featuremap输入到Bi-LSTM/Bi-GRU时的宽度大于等于最大字符数，即time_step大于等于最大字符数。最好的情况是保证time_step 大于等于最大字符数的1倍，比如你的验证码中最大的字符数位6位，那么需要保证time_step >= 6, 最好是time_step >= 12
No valid path found 问题解决：

在config.yaml中修改model -> resize的参数，自行调整为合适的值，可以尝试这个较为通用的值：resize: [150, 50]。如果你使用resize: [150, 50]还是遇到了No valid path found问题，可以考虑把图像resize到更大的尺寸或者在config.yaml中修改model -> preprocess_collapse_repeated的参数为True。
参数修改：

切记，如果修改了训练参数如：ImageWidth，ImageHeight，Resize，CharSet，CNNNetwork，RecurrentNetwork，HiddenNum 这类影响计算图的参数，需要删除checkpoint, tensorboard路径下的旧文件，重新训练。本项目默认支持断点续练。

准备工作

如果你准备使用GPU训练，请先安装CUDA和cuDNN。需要注意的是，这里使用的是tensorflow 2.0, 需要使用较新的CUDA和cuDNN。我的环境使用的是cuda 10 以及cudnn 7.6.0.64 。供大家参考。

如何使用

首先下载安装Anoconda;
然后使用conda 创建一个名为captcha的新虚拟环境conda create -n captcha python=3.6.8；
激活此虚拟环境conda activate captcha. (Windows版本激活环境命令是activate captcha)；
安装依赖的包pip install -r requirements.txt；
在congig.yaml文件中配置好相关参数，包括数据集名称、路径，所需的数据预处理操作以及训练使用的模型；
运行脚本make_dataset.py创建所需要的tfrecord文件；
将所有图片数据转换为tfrecord文件后，就可以开始训练了，运行脚本training.py开始训练。
模型的训练过程结果都记录在tensorboard logfile中，通过运行tensorboard --logdir=tensorboard/your_dataset_name --host=127.0.0.1即可可视化训练结果；
训练要有耐心，如果图片较多，一般要训练几百个epoch才可能看到明显的效果提升。
建议先使用较大的学习率进行初步训练，等准确率开始提升，模型收敛到一定程度，然后再使用较小的学习率，这样能加速得到结果。

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.idea		.idea
networks		networks
DataLoader.py		DataLoader.py
LICENSE		LICENSE
README.md		README.md
activation_mish.py		activation_mish.py
config.yaml		config.yaml
ctc_ops.py		ctc_ops.py
logger.py		logger.py
make_dataset.py		make_dataset.py
model.py		model.py
requirements.txt		requirements.txt
settings.py		settings.py
training.py		training.py

License

zoulejiu/break_captcha

Folders and files

Latest commit

History

Repository files navigation

Break Captcha

项目介绍

注意事项

准备工作

如何使用

About

Resources

License

Stars

Watchers

Forks

Languages