使用torchvision.datasets模块加载MNIST数据集,并进行必要的数据预处理,如图像转换、标准化等。
使用卷积神经网络(CNN)以提取图像中的特征,并进行训练。可以自行尝试不同的模型架构,添加或调整层、增加参数等,以提升性能。
选择叉熵损失函数(CrossEntropyLoss),用于度量模型输出与实际标签之间的差异。
选择随机梯度下降优化器(SGD)用于更新模型的参数。
训练过程定义训练循环次数epoch,遍历训练数据集并向前传播、计算损失、反向传播、更新参数使用批量训练(mini-batch)来加速训练过程,同时监控训练集上的准确率和损失函数值。