基于CNN，keras的验证码识别项目.zip资源-CSDN文库

共1404个文件

jpg：1399个

py：3个

png：1个

深度学习

Xception

127 浏览量 2024-04-03 14:42:38 上传评论收藏 81.13MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于CNN，keras的验证码识别项目.zip （1404个子文件）

captcha__model.h5 73.09MB

3n5E.jpg 13KB

PHMX.jpg 13KB

3b8b.jpg 13KB

QB18.jpg 13KB

1jrn.jpg 13KB

cYqA.jpg 13KB

fU0Q.jpg 13KB

5kpe.jpg 13KB

KHaH.jpg 13KB

82XB.jpg 13KB

DgBG.jpg 13KB

j6Ap.jpg 13KB

RvC8.jpg 13KB

xAGz.jpg 13KB

UJf8.jpg 13KB

16mf.jpg 13KB

003T.jpg 13KB

Y6s7.jpg 13KB

8V16.jpg 13KB

e5Y2.jpg 13KB

A8c5.jpg 13KB

A83a.jpg 13KB

87w8.jpg 13KB

5Mhk.jpg 13KB

s18C.jpg 13KB

Qt7R.jpg 13KB

Eb20.jpg 13KB

Y4mc.jpg 13KB

208d.jpg 13KB

kFEr.jpg 13KB

N681.jpg 13KB

3wy7.jpg 13KB

735J.jpg 13KB

5CkF.jpg 13KB

C806.jpg 13KB

nahp.jpg 13KB

B238.jpg 13KB

1We1.jpg 13KB

1GDE.jpg 13KB

Bx48.jpg 13KB

yFpn.jpg 13KB

1V8u.jpg 13KB

p1j2.jpg 13KB

wC5K.jpg 13KB

wBZK.jpg 13KB

em0q.jpg 13KB

B6Vr.jpg 13KB

0WQw.jpg 13KB

u4pR.jpg 13KB

w8XZ.jpg 13KB

xFMQ.jpg 13KB

t81k.jpg 13KB

31X0.jpg 13KB

bWt0.jpg 13KB

xWC2.jpg 13KB

zJ1s.jpg 13KB

2M8n.jpg 13KB

55nq.jpg 13KB

8205.jpg 13KB

r010.jpg 13KB

3X7D.jpg 13KB

13Yk.jpg 13KB

fs5M.jpg 13KB

tpUU.jpg 13KB

2Cg6.jpg 13KB

f083.jpg 13KB

Stc3.jpg 13KB

Qwy5.jpg 13KB

A42c.jpg 13KB

801b.jpg 13KB

1xN8.jpg 13KB

4jC8.jpg 13KB

c1ur.jpg 13KB

cems.jpg 13KB

7jEx.jpg 13KB

j87s.jpg 13KB

7YcC.jpg 13KB

36vP.jpg 13KB

XKa7.jpg 13KB

WU57.jpg 13KB

35WR.jpg 13KB

03u5.jpg 13KB

paH7.jpg 13KB

3hJA.jpg 13KB

b3RZ.jpg 13KB

3Xb5.jpg 13KB

0d02.jpg 12KB

63aQ.jpg 12KB

HUMa.jpg 12KB

A385.jpg 12KB

5AzZ.jpg 12KB

10cT.jpg 12KB

028e.jpg 12KB

8v0n.jpg 12KB

gJ0f.jpg 12KB

z038.jpg 12KB

X1q6.jpg 12KB

HFeb.jpg 12KB

JkNf.jpg 12KB

共 1404 条

import numpy as np import os from keras.preprocessing import image from keras.models import Model from keras.layers import Dense, Dropout, Flatten, Input, concatenate ,BatchNormalization from keras.layers.convolutional import Conv2D, Convolution2D, MaxPooling2D from keras.callbacks import ModelCheckpoint from keras.optimizers import Adadelta from keras.utils.vis_utils import plot_model import tensorflow as tf import glob # 验证码所包含的字符 _表示未知 captcha_word = ['0','1','2','3','4','5','6','7','8','9', 'A','B','C','D','E','F','G','H','J', 'K','M','N','P','Q','R','S','T','U','V','W','X','Y','Z', 'a','b','c','d','e','f','g','h','j','k','m','n','p', 'q','r','s','t','u','v','w','x','y','z' ] # 图片的长度和宽度 width = 240 height = 60 # 每个验证码所包含的字符数 word_len = 4 # 字符总数 word_class = len(captcha_word) samples = glob.glob(r'train/*.jpg') # 验证码素材目录 train_dir = 'data/train' # 生成字符索引，同时反向操作一次，方面还原 char_indices = dict((c, i) for i, c in enumerate(captcha_word)) indices_char = dict((i, c) for i, c in enumerate(captcha_word)) # 验证码字符串转数组 def captcha_to_vec(captcha): # 创建一个长度为字符个数 * 字符种数长度的数组 vector = np.zeros(word_len * word_class) # 文字转成成数组 for i, ch in enumerate(captcha): idex = i * word_class + char_indices[ch] vector[idex] = 1 return vector # 把数组转换回文字 def vec_to_captcha(vec): text = [] # 把概率小于0.5的改为0，标记为错误 vec[vec < 0.5] = 0 char_pos = vec.nonzero()[0] for i, ch in enumerate(char_pos): text.append(captcha_word[ch % word_class]) return ''.join(text) # 自定义评估函数 def custom_accuracy(y_true, y_pred): predict = tf.reshape(y_pred, [-1, word_len, word_class]) max_idx_p = tf.argmax(predict, 2)#这个做法牛逼，不用再做stack和reshape了，2，是在Charset那个维度上 max_idx_l = tf.argmax(tf.reshape(y_true, [-1, word_len,word_class]), 2) correct_pred = tf.equal(max_idx_p, max_idx_l) _result = tf.map_fn(fn=lambda e: tf.reduce_all(e),elems=correct_pred,dtype=tf.bool) return tf.reduce_mean(tf.cast(_result, tf.float32)) # test_vec = captcha_to_vec("ngF4") # vec_test = vec_to_captcha(test_vec) # print(test_vec) # print(vec_test) #获取目录下样本列表 image_list = [] # for item in os.listdir(train_dir): image_list.append(item) np.random.shuffle(image_list) #创建数组，储存图片信息。结构为(50321, 36, 120, 3)，50321代表样本个数，然后是宽度和高度。 # 3代表图片的通道数，如果对图片进行了灰度处理，可以改为单通道 1 X = np.zeros((len(image_list), height, width, 3), dtype = np.uint8) # 创建数组，储存标签信息 y = np.zeros((len(image_list), word_len * word_class), dtype = np.uint8) for i,img in enumerate(image_list): if i % 10000 == 0: print(i) img_path = train_dir + "/" + img #读取图片 raw_img = image.load_img(img_path, target_size=(height, width)) #讲图片转为np数组 X[i] = image.img_to_array(raw_img) #讲标签转换为数组进行保存 y[i] = captcha_to_vec(img.split('.')[0]) #创建输入，结构为高，宽，通道 input_tensor = Input( shape=(height, width, 3)) x = input_tensor #构建卷积网络 #两层卷积层，一层池化层，重复3次。因为生成的验证码比较小，padding使用same x = Convolution2D(32, 3, padding='same', activation='relu')(x) x = Convolution2D(32, 3, padding='same', activation='relu')(x) # x= BatchNormalization()(x) x = MaxPooling2D((2, 2))(x) x = Convolution2D(64, 3, padding='same', activation='relu')(x) x = Convolution2D(64, 3, padding='same', activation='relu')(x) # x= BatchNormalization()(x) x = MaxPooling2D((2, 2))(x) x = Convolution2D(128, 3, padding='same', activation='relu')(x) x = Convolution2D(128, 3, padding='same',activation='relu')(x) # x= BatchNormalization()(x) x = MaxPooling2D((2, 2))(x) #Flatten层用来将输入“压平”，即把多维的输入一维化，常用在从卷积层到全连接层的过渡。 x = Flatten()(x) #为输入数据施加Dropout。Dropout将在训练过程中每次更新参数时随机断开一定百分比（rate）的输入神经元，Dropout层用于防止过拟合。 x = Dropout(0.25)(x) x= BatchNormalization()(x) #Dense就是常用的全连接层 #最后连接4个分类器，每个分类器是56个神经元，分别输出56个字符的概率。 x = [Dense(word_class, activation='softmax', name='c%d'%(i+1))(x) for i in range(word_len)] # x = [Dense(word_class, activation='sigmoid', name='c%d'%(i+1))(x) for i in range(word_len)] output = concatenate(x) #构建模型 model = Model(inputs=input_tensor, outputs=output) # model.add(BatchNormalization()) #因为训练可能需要数个小时，所以这里加载了之前我训练好的参数。准确率为94% #可以直接使用此参数继续进行训练，也可以自己从头开始训练 model.load_weights('model/weights.10--6.55-0.3062.hdf5') #这里优化器选用Adadelta，学习率0.1 opt = Adadelta(lr=0.1) #编译模型以供训练，损失函数使用 categorical_crossentropy，使用accuracy评估模型在训练和测试时的性能的指标 # model.compile(loss = 'categorical_crossentropy', optimizer=opt, metrics=['accuracy']) model.compile(loss = 'categorical_crossentropy', optimizer=opt, metrics=['accuracy',custom_accuracy]) #每次epoch都保存一下权重，用于继续训练 checkpointer = ModelCheckpoint(filepath="model/weights.{epoch:02d}--{val_loss:.2f}-{val_acc:.4f}.hdf5", verbose=2, save_weights_only=True) #开始训练，validation_split代表10%的数据不参与训练，用于做验证急 #我之前训练了50个epochs以上，这里根据自己的情况进行选择。如果输出的val_acc已经达到你满意的数值，可以终止训练 model.fit(X, y, epochs= 10,callbacks=[checkpointer], validation_split=0.1) # plot model plot_model(model, to_file='model/model.png', show_shapes=True) # model.fit(X, y, epochs= 50, validation_split=0.1) #保存权重和模型 model.save_weights('model/captcha_model_weights.h5') model.save('model/captcha__model_2.h5')

评论收藏

内容反馈