基于LeNet-5的MNIST字符识别.zip_pytorchlenet-5自建字符识别资源-CSDN文库

共2个文件

py：1个

pth：1个

版权申诉

2 浏览量 2023-08-23 09:06:54 上传评论收藏 233KB ZIP 举报

《基于LeNet-5的MNIST字符识别：PyTorch深度学习实践》在现代计算机视觉领域，深度学习已经成为解决图像识别任务的核心技术。本项目是关于使用PyTorch框架实现经典的LeNet-5网络对MNIST手写数字数据集进行识别的实战案例。MNIST数据集是计算机视觉入门的经典数据，包含60,000个训练样本和10,000个测试样本，每个样本都是28x28像素的灰度图像，代表0到9的手写数字。 LeNet-5是Yann LeCun在1998年提出的卷积神经网络（Convolutional Neural Network, CNN）模型，它在当时主要用于光学字符识别（OCR）。LeNet-5的结构包括两个卷积层、两个最大池化层、一个全连接层以及一个输出层，这种架构为后续的CNN设计奠定了基础。在PyTorch中实现LeNet-5，首先需要导入必要的库，如torch、torch.nn和torch.optim。LeNet模型的定义通常包括以下部分： 1. 卷积层(Conv2d)：用于提取图像特征，每个卷积层后通常会接一个激活函数，如ReLU，增加模型的非线性表达能力。 2. 池化层(MaxPool2d)：用于降低数据的空间维度，减少计算量，同时保持特征的最重要信息。 3. 全连接层(Flatten和Linear)：将卷积层处理后的二维特征图转换成一维向量，再通过多层线性变换，最终进行分类。在LeNet.py文件中，我们将定义这样的网络结构，并在训练过程中使用优化器（如SGD）和损失函数（如交叉熵损失CrossEntropyLoss）进行模型的训练。net.pth文件则是训练完成后保存的模型权重，用于后续预测阶段加载模型。训练过程通常分为以下几个步骤： 1. 数据预处理：MNIST数据集的图片需要归一化到0-1之间，以适应神经网络的输入需求。 2. 定义模型：创建LeNet-5网络实例。 3. 编译模型：设置损失函数和优化器。 4. 训练模型：通过多次迭代，让模型在训练数据上学习。 5. 评估模型：在测试集上检验模型的性能，如准确率等指标。 6. 保存模型：将训练好的模型权重保存，以便后续使用。通过这个项目，你可以深入理解PyTorch框架如何构建和训练CNN模型，以及LeNet-5网络在实际问题中的应用。此外，你还可以学习到如何处理和预处理图像数据，以及如何评估和调优深度学习模型。对于初学者来说，这是一个很好的起点，帮助他们掌握深度学习的基础知识和实践经验。对于有经验的开发者，这个项目也是一个回顾经典模型和框架功能的好机会。

资源推荐

资源详情

资源评论

收起资源包目录

基于LeNet-5的MNIST字符识别.zip （2个子文件）

net.pth 262KB

LeNet.py 4KB

import torch import torchvision import torch.nn as nn from torchvision import datasets, transforms import matplotlib.pyplot as plt import numpy as np import cv2 from torch import optim import time # 训练设备选择 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") # batch的大小 batch_size = 100 class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() self.conv = nn.Sequential( # 卷积层C1 nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2), # 32,32 to 28*28 nn.Sigmoid(), # 池化层S2 nn.MaxPool2d(kernel_size=2, stride=2), # 28*28 to 14*14 # 卷积层C3 nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5), # 10*10 nn.Sigmoid(), # 池化层S4 nn.MaxPool2d(kernel_size=2, stride=2), # 10*10 to 5*5 ) self.fullconnect = nn.Sequential( nn.Linear(16*5*5, 120), nn.Sigmoid(), nn.Linear(120, 84), nn.Sigmoid(), nn.Linear(84, 10) ) def forward(self, inputs): output = self.conv(inputs) # 将高维向量flatten output = self.fullconnect(output.view(inputs.shape[0], -1)) return output # 实例化 # net = LeNet() #加载之前训练好的模型 net = torch.load("net.pth") net.to(device) # 打印模型 print(net) # 对输入变量的操作 transform = transforms.Compose([ transforms.ToTensor(), # 转为Tensor transforms.Normalize((0.5,), (0.5,)), # 归一化 ]) # 返回值为mnist类 train_dataset = torchvision.datasets.MNIST( root='./mnist', train=True, transform=transform, download=False) test_dataset = torchvision.datasets.MNIST( root='./mnist', train=False, transform=transform, download=False) # 数据加载器,返回list[0]为100,1,28,28 list[1] 100 trainloader = torch.utils.data.DataLoader( train_dataset, batch_size=batch_size, shuffle=False, num_workers=0) testloader = torch.utils.data.DataLoader( test_dataset, batch_size=batch_size, shuffle=False, num_workers=0) def main(): # 交叉熵损失函数 criterion = nn.CrossEntropyLoss() # 优化器 optimizer = optim.Adam(net.parameters(), lr=0.01) running_loss = 0.0 # 初始化loss loss_list = [] for epoch in range(5): start = time.time() running_loss = 0.0 for i, (inputs, labels) in enumerate(trainloader, 0): net.train() # 输入数据 inputs = inputs.to(device) labels = labels.to(device) # 梯度清零 optimizer.zero_grad() outputs = net(inputs) loss = criterion(outputs, labels) loss.backward() # 更新参数 optimizer.step() running_loss += loss.item() loss_list.append(loss.item()) print("loss:",running_loss,"\n") net.eval() with torch.no_grad(): # 测试集不需要计算梯度，放在torch.no_grad()节省计算资源 # 总共正确的数量 total_correct = 0 #总共的数量 total_num = 0 for inputs, labels in trainloader: # 输入数据 inputs = inputs.to(device) labels = labels.to(device) #输出数据 outputs = net(inputs) #输出的数据选取概率最大的值 pred = outputs.argmax(dim=1) #eq函数比较是否相等返回相等的和 total_correct += torch.eq(labels, pred).float().sum() total_num += inputs.size(0) acc = total_correct/total_num print('测试集正确率为 :', (acc*100),"\n") end = time.time() print("训练时间:",end-start,"\n") main() #保存模型 torch.save(net, "net.pth")

评论收藏

内容反馈

版权申诉