Skip to content

duxiu727/12306_captcha

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

根据网上流传的方法尝试破解12306的验证码

文字和图片的组合验证

环境

urllib2.Request(url + str(len("图片")), "图片", {'Content-Type':'image/png', 'User-Agent':UA})

百度识别12306,屏蔽了小尺寸的图片识别(100px以下的)使用ImageMagick放大尺寸。 切图和放大图片,需要安装一下ImageMagick,确保能在命令行打出convert命令。

//放大图片尺寸 
def resizeImg() 
{ 
	arrargs = ["-resize", "440", "./test.jpg", "./new_test.jpg"]; 
	command = "convert"+ arrargs[0] + arrargs[1]+arrargs[2]+arrargs[3] os.system(command) 
}

深度学习

  • 学习深度学习后,使用基于thneano的keras可以构建卷积神经网络进行识别,用爬虫从sina和百度上做好样本后,编码实现网络,得到合适的训练的模型,效果还不错,调整参数和加大样本后,正确率估计达到0.92以上。
  • 样本分为文本和图片

About

CNN对12306、sina、baidu的验证码破解。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%