实验二 猫狗分类
实验内容
实验二是猫狗分类,使用 Kaggle 猫狗分类的原始数据集,实现模型最终的准确率达到75%及以上。本
实验的目的是为了进一步掌握使用深度学习框架进行图像分类任务的具体流程:如读取数据、构造网
络、训练和测试模型等等。实验报告将从实验环境、数据预处理、实验分析4个方面进行阐述。
实验环境
本实验采用 Anaconda3 + Pycharm 框架进行开发,深度学习框架采用 PyTorch 框架,各类版本号如下:
python 3.7.10
pytorch 1.8.1 GPU
CUDA 10.2
cudnn 8.2.0
tensorboard 2.4.1
tensorboardX 2.2
hiddenlayer 0.3
数据预处理
数据集分配
训练数据集:从原始训练数据集中选择16000张打乱的猫狗图片中选择70%作为训练数据集,共计
11200张
验证数据集:从原始训练数据集中16000张打乱的猫狗图片中选择30%作为训练数据集,共计4800
张
测试数据集:从原始训练数据集中选择4000张作为测试集
预处理
训练数据集进行数据增强
测试与验证数据集不进行数据增强
transforms.Compose([
transforms.Resize(size=(256, 256)),
transforms.RandomResizedCrop(size=(224, 224)),
transforms.RandomHorizontalFlip(),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225])
])
1
2
3
4
5
6
7
8