# -*- coding: UTF-8 -*-
import os
from torch.utils.data import DataLoader,Dataset
import torchvision.transforms as transforms
from PIL import Image
import one_hot_encoding as ohe
import captcha_setting
class mydataset(Dataset):
def __init__(self, folder, transform=None):
self.train_image_file_paths = [os.path.join(folder, image_file) for image_file in os.listdir(folder)]
self.transform = transform
def __len__(self):
return len(self.train_image_file_paths)
def __getitem__(self, idx):
image_root = self.train_image_file_paths[idx]
image_name = image_root.split(os.path.sep)[-1]
image = Image.open(image_root)
if self.transform is not None:
image = self.transform(image)
label = ohe.encode(image_name.split('_')[0]) # 为了方便,在生成图片的时候,图片文件的命名格式 "4个数字或者数字_时间戳.PNG", 4个字母或者即是图片的验证码的值,字母大写,同时对该值做 one-hot 处理
return image, label
transform = transforms.Compose([
# transforms.ColorJitter(),
transforms.Grayscale(),
transforms.ToTensor(),
# transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
def get_train_data_loader():
dataset = mydataset(captcha_setting.TRAIN_DATASET_PATH, transform=transform)
return DataLoader(dataset, batch_size=64, shuffle=True)
def get_test_data_loader():
dataset = mydataset(captcha_setting.TEST_DATASET_PATH, transform=transform)
return DataLoader(dataset, batch_size=1, shuffle=True)
def get_predict_data_loader():
dataset = mydataset(captcha_setting.PREDICT_DATASET_PATH, transform=transform)
return DataLoader(dataset, batch_size=1, shuffle=True)
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
基于CNN训练的一套 端到端 的验证码识别模型,使用深度学习+训练数据+大量计算力.zip (48个子文件)
pytorch-captcha-recognition-master
captcha_cnn_model.py 1KB
dataset
train
2PUI_1539937370.png 6KB
U206_1539937370.png 7KB
HQM1_1539937370.png 7KB
B647_1539937370.png 8KB
PY55_1539937370.png 8KB
GQT4_1539937370.png 7KB
IDQY_1539937370.png 7KB
2TFY_1539937370.png 6KB
46AL_1539937370.png 7KB
11IL_1539937370.png 6KB
MLYM_1539937370.png 7KB
AVQK_1539937370.png 9KB
RB3A_1539937370.png 8KB
MFVG_1539937370.png 8KB
4MEM_1539937370.png 9KB
F4I1_1539937370.png 7KB
XK7E_1539937370.png 7KB
2ZWW_1539937370.png 7KB
UV27_1539937370.png 7KB
P9QN_1539937370.png 9KB
1BWB_1539937370.png 8KB
F3SR_1539937370.png 8KB
55IC_1539937370.png 8KB
DRF0_1539937370.png 8KB
A41S_1539937370.png 7KB
HWD5_1539937370.png 9KB
OIW9_1539937370.png 9KB
S50Z_1539937370.png 8KB
1G4J_1539937370.png 7KB
XY0K_1539937370.png 9KB
predict
JFA6_1539936857.png 7KB
2BVC_1539936857.png 7KB
X4E9_1539936857.png 8KB
5X09_1539936857.png 8KB
KAWJ_1539936857.png 8KB
test
2PUI_1539937370.png 6KB
1BWB_1539937370.png 8KB
1G4J_1539937370.png 7KB
docs
number2.png 141KB
number.png 148KB
my_dataset.py 2KB
captcha_predict.py 1KB
captcha_test.py 2KB
one_hot_encoding.py 1KB
captcha_train.py 1KB
captcha_gen.py 1KB
captcha_setting.py 607B
共 48 条
- 1
资源评论
博士僧小星
- 粉丝: 1936
- 资源: 5894
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功