# ocr_recognition
验证码识别,该模型是基于xlvector模型上进行加工,验证码内容包含了大小字母以及数字,采用lstm+warp-ctc+cnn达到不分割字符而识别验证码内容~
验证码识别,该模型是基于xlvector编写的一段识别数字的代码上进行加工,验证码内容包含了大小字母以及数字,采用lstm+warp-ctc+cnn达到不分割字符而识别验证码>内容~
几点说明:
1. 该模型是基于mxnet框架训练而来,基于环境为ubuntu 14,支持GPU和CPU两种模式,如果要运行该代码,需要具备如下软件支持:
1. opencv
2. openblas
3. torch
4. cmake
5. mxnet
6. warp-ctc
7. python2.7
8. gcc(如果版本太低,要么去掉warp-ctc对应mk目录下的std11标识符,改为std0即可)
2. 对于代码的相应的描述:
ocr_train.py 为训练模型文件,可以微调模型
ocr_predict.py 训练好的模型进行训练
lstm_model.py 分装的mx.model,值实现了前馈网络.
generator.py 该代码自动生成验证码(为了节约时间,直接摘自网络,再次鸣谢作者).
lstm.py ctc算法处理数据
3.验证码效果:
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/0_1SbM.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/14_EfQu.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/4_z9Dt.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/15_mJbV.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/20_e7dW.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/26_VYxG.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/38_dyRT.jpg)
![image](https://github.com/gongxijun/ocr_recognition/blob/master/img_data/iamge/47_0062.jpg)
4.实际预测效果
Predicted number: C888 实际值: C888
Predicted number: CKCX 实际值: GKGX
Predicted number: dEpw 实际值: dEpw
Predicted number: 2586 实际值: 2586
Predicted number: GEvZ 实际值: CEvZ
Predicted number: GMXz 实际值: OwKz
Predicted number: YLSc 实际值: VjSc
Predicted number: WwhG 实际值: Wwh0
Predicted number: U4p 实际值: U2AJ
Predicted number: vz6C 实际值: yz6G
Predicted number: F5l0 实际值: FRl0
Predicted number: 3039 实际值: 3039
Predicted number: 6756 实际值: 6756
Predicted number: BsX5 实际值: DCX5
Predicted number: 5m3y 实际值: 5m3y
Predicted number: 0BRd 实际值: OBRd
Predicted number: 9133 实际值: 9133
没有合适的资源?快使用搜索试试~ 我知道了~
基于xlvector模型上进行加工,验证码内容包含了大小字母以及数字,采用lstm+warp-ctc+cnn
共26个文件
params:9个
jpg:8个
py:5个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 158 浏览量
2024-05-22
17:03:07
上传
评论
收藏 7.38MB ZIP 举报
温馨提示
验证码识别,该模型是基于xlvector模型上进行加工,验证码内容包含了大小字母以及数字,采用lstm+warp-ctc+cnn达到不分割字符而识别验证码内容~LSTM (Long Short-Term Memory) 是一种特殊的循环神经网络(RNN)架构,用于处理具有长期依赖关系的序列数据。传统的RNN在处理长序列时往往会遇到梯度消失或梯度爆炸的问题,导致无法有效地捕捉长期依赖。LSTM通过引入门控机制(Gating Mechanism)和记忆单元(Memory Cell)来克服这些问题。 以下是LSTM的基本结构和主要组件: 记忆单元(Memory Cell):记忆单元是LSTM的核心,用于存储长期信息。它像一个传送带一样,在整个链上运行,只有一些小的线性交互。信息很容易地在其上保持不变。 输入门(Input Gate):输入门决定了哪些新的信息会被加入到记忆单元中。它由当前时刻的输入和上一时刻的隐藏状态共同决定。 遗忘门(Forget Gate):遗忘门决定了哪些信息会从记忆单元中被丢弃或遗忘。它也由当前时刻的输入和上一时刻的隐藏状态共同决定。 输出门(Output Gate):输出门决定了哪些信息会从记忆单元中输出到当前时刻的隐藏状态中。同样地,它也由当前时刻的输入和上一时刻的隐藏状态共同决定。 LSTM的计算过程可以大致描述为: 通过遗忘门决定从记忆单元中丢弃哪些信息。 通过输入门决定哪些新的信息会被加入到记忆单元中。 更新记忆单元的状态。 通过输出门决定哪些信息会从记忆单元中输出到当前时刻的隐藏状态中。 由于LSTM能够有效地处理长期依赖关系,它在许多序列建模任务中都取得了很好的效果,如语音识别、文本生成、机器翻译、时序预测等。
资源推荐
资源详情
资源评论
收起资源包目录
验证码识别,该模型是基于xlvector模型上进行加工,验证码内容包含了大小字母以及数字,采用lstm+warp-ctc+cnn达到不分割字符而识别验证码内容~.zip (26个子文件)
content
img_data
iamge
20_e7dW.jpg 2KB
38_dyRT.jpg 2KB
14_EfQu.jpg 2KB
0_1SbM.jpg 2KB
47_0062.jpg 2KB
15_mJbV.jpg 2KB
4_z9Dt.jpg 2KB
26_VYxG.jpg 2KB
recaptcha
generator.py 8KB
lstm_model.pyc 2KB
lstm.py 6KB
lstm.pyc 5KB
ocr_predict.py 2KB
lstm_model.py 2KB
ocr_train.py 8KB
model
model-0050.params 1008KB
model-0030.params 1008KB
model-0040.params 1008KB
model-0020.params 1008KB
model-0080.params 1008KB
model-symbol.json 111KB
model-0005.params 1008KB
model-0070.params 1008KB
model-0060.params 1008KB
model-0010.params 1008KB
README.md 3KB
共 26 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3910
- 资源: 7441
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功