# 深度学习识别各类验证码
## 背景介绍
- 来源:第九届中国大学生服务外包创新创业大赛赛题**A16-验证码识别**
- 整体背景:验证码识别是计算机与大数据领域一个非常重要的应用领域,其中包含了图像处理、机器视觉、模式识别以及人工智能等诸多前沿技术,这些同样也是大数据未来发展所必须的核心技术。本赛题以互联网中常见的验证码图片为样本,旨在通过此次竞赛,检验参赛者的图像识别能力,提高对计算机技术、算法模型的认识和应用能力,激发在图像处理、机器学习等领域的创新能力。
- 公司背景:**浪潮**卓数大数据产业发展有限公司作为浪潮集团旗下的大数据板块,致力于成为数据资源提供商、数据资产运营商和数据交易服务商,以大数据时代的“数商”为发展目标,促进政府、企业和个人实现从互联网化向社会化,乃至数据社会化的转变。
## 项目说明
### 问题说明
提供 5 类验证码图片,难度依次递增,每一类验证码提供 1 万个训练样本,最后通过另外 5000 个测试样本的识别率评分。
### 第 1 类
数字四则运算,有噪点干扰,输出计算结果。
![captcha1](https://github.com/czczup/Captcha-Recognition/blob/master/docs/captcha1.png?raw=true)
### 第 2 类
英文字母+数字验证码,包含 5 个字符,有噪点干扰,文字无旋转形变,验证方法为要求用户输出验证码中的字符,大小写不限( 为验证方便可统一转为大写 )。
![captcha2](https://github.com/czczup/Captcha-Recognition/blob/master/docs/captcha2.png?raw=true)
### 第 3 类
英文字母+数字验证码,包含 4 个字符,有噪点干扰,文字有旋转形变,验证方法为要求用户输出验证码中的字符。
![captcha3](https://github.com/czczup/Captcha-Recognition/blob/master/docs/captcha3.png?raw=true)
### 第 4 类
中文验证码,包含 4 个中文汉字,有噪点干扰,验证方法为要求用户选出 4 个汉字中被旋转 90 度的那一个 (四个汉字从左到右序号为 0,1,2,3,输出被旋转的汉字序号即可) 。
![captcha4](https://github.com/czczup/Captcha-Recognition/blob/master/docs/captcha4.png?raw=true)
### 第 5 类
中文验证码,包含 4 个中文汉字和 9 个中文单字,有噪点干扰,文字有旋转形变,验证方法为要求用户从 9 个单字中从左到右按顺序选出验证码中的汉字,输出汉字编号。
![captcha5](https://github.com/czczup/Captcha-Recognition/blob/master/docs/captcha5.png?raw=true)
## 快速开始
- **步骤一:环境准备**
Python 3.6、TensorFlow、Pillow、OpenCV
```
pip install tensorflow-gpu==1.8
pip install opencv-python
pip install pillow
```
- **步骤二:准备数据集**
下载地址:[百度网盘](https://pan.baidu.com/s/1A07EiNpy7e3sXSyaVyDvSA)
提取码:**e6zy**
放置位置:
- 训练集:level_/image/train
- 测试集:level_/image/test
- **步骤三:选择验证码类型**
- [第一类:数字四则运算,有噪点干扰,输出计算结果](https://github.com/czczup/Captcha-Recognition/tree/master/level1)
- [第二类:数字、英文,有噪点干扰,文字无旋转形变,输出数字、英文](https://github.com/czczup/Captcha-Recognition/tree/master/level2)
- [第三类:数字、英文,有噪点干扰,文字有旋转形变,输出数字、英文](https://github.com/czczup/Captcha-Recognition/tree/master/level3)
- [第四类:汉字,有噪点干扰,文字无旋转形变,输出汉字](https://github.com/czczup/Captcha-Recognition/tree/master/level4)
- [第五类:汉字,有噪点干扰,文字有旋转形变,输出汉字](https://github.com/czczup/Captcha-Recognition/tree/master/level5)
### 最后
当时做这个项目的时候是第一次接触深度学习,看着吴恩达和炼数成金的视频课边学边做,真是特别有意思的一段时光。现在回头来看,当时设计的每类验证码识别模型都不同,准确率主要靠调参,确实挺ugly的。还记得答辩的时候评委问我,能不能做一个万能验证码识别模型,可惜当时学识浅陋,我答的“不行”,哈哈。
通过这次竞赛,成功让我入门了深度学习,特别感谢浪潮集团出的题和提供的奖金。当年这题获奖的名额超多的,浪潮真的财大气粗,若要参加服务外包竞赛,浪潮的题目超级推荐。验证码识别是特别好的深度学习入门案例,希望本仓库能给刚入门的你提供一些帮助。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【探索人工智能的宝藏之地】 无论您是计算机相关专业的在校学生、老师,还是企业界的探索者,这个项目都是为您量身打造的。无论您是初入此领域的小白,还是寻求更高层次进阶的资深人士,这里都有您需要的宝藏。不仅如此,它还可以作为毕设项目、课程设计、作业、甚至项目初期的立项演示。 【人工智能的深度探索】 人工智能——模拟人类智能的技术和理论,使其在计算机上展现出类似人类的思考、判断、决策、学习和交流能力。这不仅是一门技术,更是一种前沿的科学探索。 【实战项目与源码分享】 我们深入探讨了深度学习的基本原理、神经网络的应用、自然语言处理、语言模型、文本分类、信息检索等领域。更有深度学习、机器学习、自然语言处理和计算机视觉的实战项目源码,助您从理论走向实践,如果您已有一定基础,您可以基于这些源码进行修改和扩展,实现更多功能。 【期待与您同行】 我们真诚地邀请您下载并使用这些资源,与我们一起在人工智能的海洋中航行。同时,我们也期待与您的沟通交流,共同学习,共同进步。让我们在这个充满挑战和机遇的领域中共同探索未来!
资源推荐
资源详情
资源评论
收起资源包目录
人工智能项目资料-基于深度学习和TensorFlow的英文和汉字验证码识别.zip (146个子文件)
checkpoint 97B
checkpoint 95B
events.out.tfevents.1523087561.cz 1.01MB
events.out.tfevents.1523087561.cz 1.01MB
events.out.tfevents.1523148082.cz 790KB
events.out.tfevents.1523148082.cz 790KB
events.out.tfevents.1523183431.cz 654KB
events.out.tfevents.1523183431.cz 654KB
events.out.tfevents.1523192683.cz 621KB
events.out.tfevents.1523192683.cz 621KB
events.out.tfevents.1523496649.cz 601KB
events.out.tfevents.1523496649.cz 601KB
events.out.tfevents.1523487939.cz 543KB
events.out.tfevents.1523487939.cz 543KB
events.out.tfevents.1523147978.cz 422KB
events.out.tfevents.1523147978.cz 422KB
events.out.tfevents.1522212874.cz 338KB
events.out.tfevents.1522212874.cz 338KB
events.out.tfevents.1527167339.cz 327KB
events.out.tfevents.1527167340.cz 327KB
events.out.tfevents.1523509773.cz 320KB
events.out.tfevents.1523509773.cz 320KB
events.out.tfevents.1523715175.cz 269KB
events.out.tfevents.1523715175.cz 269KB
events.out.tfevents.1522219170.cz 259KB
events.out.tfevents.1522219170.cz 259KB
events.out.tfevents.1522220894.cz 243KB
events.out.tfevents.1522220894.cz 243KB
events.out.tfevents.1522221736.cz 238KB
events.out.tfevents.1522221736.cz 238KB
events.out.tfevents.1523715062.cz 232KB
events.out.tfevents.1523715062.cz 232KB
events.out.tfevents.1523509714.cz 232KB
events.out.tfevents.1522221658.cz 232KB
events.out.tfevents.1522219144.cz 232KB
events.out.tfevents.1522219144.cz 232KB
events.out.tfevents.1523507894.cz 232KB
events.out.tfevents.1523487899.cz 231KB
events.out.tfevents.1523408205.cz 147KB
events.out.tfevents.1523408205.cz 147KB
events.out.tfevents.1523408157.cz 123KB
events.out.tfevents.1522224052.cz 123KB
events.out.tfevents.1523408157.cz 123KB
events.out.tfevents.1522224052.cz 123KB
model_level5.ckpt-9000.data-00000-of-00001 48.33MB
model_level2.ckpt-71000.data-00000-of-00001 30.04MB
model_level3.ckpt-800.data-00000-of-00001 18.04MB
model_level1.ckpt-288.data-00000-of-00001 13.21MB
model_level4.ckpt-1500.data-00000-of-00001 9.72MB
.gitattributes 378B
.gitignore 2KB
model_level4.ckpt-1500.index 2KB
model_level5.ckpt-9000.index 902B
model_level1.ckpt-288.index 778B
model_level2.ckpt-71000.index 521B
model_level3.ckpt-800.index 520B
README.md 5KB
README.md 3KB
README.md 3KB
README.md 3KB
README.md 2KB
README.md 2KB
model_level5.ckpt-9000.meta 223KB
model_level4.ckpt-1500.meta 220KB
model_level3.ckpt-800.meta 138KB
model_level2.ckpt-71000.meta 137KB
model_level1.ckpt-288.meta 99KB
problem2.png 1.82MB
problem3.png 1.57MB
problem1.png 1.29MB
problem4.png 914KB
net3_.png 116KB
net5_.png 113KB
net2_.png 112KB
captcha5.png 108KB
net4_.png 92KB
captcha2.png 92KB
denoise1.png 71KB
problem5.png 67KB
net5.png 64KB
denoise2.png 62KB
captcha3.png 59KB
captcha4.png 54KB
captcha1.png 54KB
net4.png 42KB
net3.png 41KB
net2.png 41KB
net1_.png 39KB
net1.png 28KB
denoise_opencv.py 5KB
train.py 5KB
model.py 5KB
generate_batch_data.py 5KB
model.py 5KB
model.py 5KB
train.py 4KB
train.py 4KB
train.py 4KB
train.py 4KB
model.py 4KB
共 146 条
- 1
- 2
资源评论
妄北y
- 粉丝: 1w+
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功