VGGNet图像分类算法资源-CSDN文库

共14个文件

py：7个

jpg：5个

json：1个

VGGNet

图像分类

164 浏览量 2024-05-08 11:45:03 上传评论收藏 478.37MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

vgg.zip （14个子文件）

cow_chute_class_indices.json 102B

weights

vgg16net.pth 512.25MB

vgg_val_acc.jpg 16KB

data

tulip.jpg 35KB

vgg_train_acc.jpg 16KB

runs

utils

__init__.py 78B

train_val_utils.py 2KB

__pycache__

data_utils.py 6KB

vgg_train_loss.jpg 15KB

vgg_train.py 4KB

vgg_predict.py 2KB

models

__init__.py 72B

__pycache__

vggnet.py 3KB

vgg_val_loss.jpg 19KB

""" @File : data_utils.py @Author : CodeCat @Time : 2021/7/8 上午10:40 """ import os import json import random import matplotlib.pyplot as plt from PIL import Image import torch from torch.utils.data import Dataset, DataLoader from torchvision import transforms def read_split_data(class_file_name,root: str, val_rate: float = 0.2, plot_image: bool = False): # 保证随机结果可复现 random.seed(0) assert os.path.exists(root), f"dataset root {root} does not exist." # 遍历文件夹，一个文件夹对应一个类别 flower_classes = [cla for cla in os.listdir(root) if os.path.isdir(os.path.join(root, cla))] # 排序，保证顺序一致 flower_classes.sort() # 给类别进行编码，生成对应的数字索引 class_indices = dict((k, v) for v, k in enumerate(flower_classes)) json_str = json.dumps(dict((val, key) for key, val in class_indices.items()), indent=4) #with open('class_indices.json', 'w') as f: with open(class_file_name,'w') as f: f.write(json_str) # 训练集所有图片的路径和对应索引信息 train_images_path, train_iamges_label = [], [] # 验证集所有图片的路径和对应索引信息 val_images_path, val_images_label = [], [] # 每个类别的样本总数 every_class_num = [] # 支持的图片格式 images_format = [".jpg", ".JPG", ".png", ".PNG"] # 遍历每个文件夹下的文件 for cla in flower_classes: cla_path = os.path.join(root, cla) # 获取每个类别文件夹下所有图片的路径 images = [os.path.join(cla_path, i) for i in os.listdir(cla_path) if os.path.splitext(i)[-1] in images_format] # 获取类别对应的索引 image_class = class_indices[cla] # 获取此类别的样本数 every_class_num.append(len(images)) # 按比例随机采样验证集 val_path = random.sample(images, k=int(len(images) * val_rate)) for img_path in images: if img_path in val_path: val_images_path.append(img_path) val_images_label.append(image_class) else: train_images_path.append(img_path) train_iamges_label.append(image_class) print(f"{sum(every_class_num)} images found in dataset.") print(f"{len(train_images_path)} images for training.") print(f"{len(val_images_path)} images for validation.") if plot_image: plt.bar(range(len(flower_classes)), every_class_num, align='center') plt.xticks(range(len(flower_classes)), flower_classes) for i, v in enumerate(every_class_num): plt.text(x=i, y=v + 5, s=str(v), ha='center') plt.xlabel('image class') plt.ylabel('number of images') plt.title('flower class distribution') plt.show() return train_images_path, train_iamges_label, val_images_path, val_images_label class MyDataSet(Dataset): """自定义数据集""" def __init__(self, images_path: list, images_label: list, transform=None): self.images_path = images_path self.images_label = images_label self.transform = transform def __len__(self): return len(self.images_path) def __getitem__(self, item): img = Image.open(self.images_path[item]) if img.mode != 'RGB': img = img.convert('RGB') label = self.images_label[item] if self.transform is not None: img = self.transform(img) return img, label @staticmethod def collate_fn(batch): images, labels = tuple(zip(*batch)) images = torch.stack(images, dim=0) labels = torch.as_tensor(labels) return images, labels def getStat(train_data): train_loader = torch.utils.data.DataLoader( train_data,batch_size=1,shuffle=False,num_workers=0, pin_memory=True) mean = torch.zeros(3) std = torch.zeros(3) for X,_ in train_loader: for d in range(3): mean[d] += X[:,d,:,:].mean() std[d] += X[:,d,:,:].std() mean.div_(len(train_data)) std.div_(len(train_data)) print(list(mean.numpy()),list(std.numpy())) def get_dataset_dataloader(data_path, batch_size,class_file_name): train_images_path, train_iamges_label, val_images_path, val_images_label = read_split_data(class_file_name,root=data_path) data_transform = { "train": transforms.Compose([transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])]), "val": transforms.Compose([transforms.Resize(224), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])]) } train_dataset = MyDataSet(images_path=train_images_path, images_label=train_iamges_label, transform=data_transform['train']) val_dataset = MyDataSet(images_path=val_images_path, images_label=val_images_label, transform=data_transform['val']) nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8]) print(f"Using {nw} dataloader workers every process.") train_dataloader = DataLoader( dataset=train_dataset, batch_size=batch_size, shuffle=True, pin_memory=True, num_workers=nw, collate_fn=train_dataset.collate_fn ) val_dataloader = DataLoader( dataset=val_dataset, batch_size=batch_size, shuffle=False, pin_memory=True, num_workers=nw, collate_fn=val_dataset.collate_fn ) return train_dataset, val_dataset, train_dataloader, val_dataloader

评论收藏

内容反馈