cnn_train_dag.rar_CNN_load_cnn_dag_thrownaqr_train

共1个文件

m：1个

版权申诉

127 浏览量 2022-09-23 20:39:07 上传评论收藏 5KB RAR 举报

标题中的“cnn_train_dag.rar”暗示了一个关于卷积神经网络（CNN）训练的项目，其中dag可能代表数据处理图或数据流图，而“thrownaqr_train”可能指的是在训练过程中处理缺失值或异常值的方法。描述简单地提到了“CNN TRAIN CONVENTIONAL NEURAL NETWORK”，意味着我们将讨论如何训练一个标准的卷积神经网络。卷积神经网络（CNN）是深度学习领域的一种重要模型，特别适合图像识别和计算机视觉任务。它通过利用卷积层来提取特征，池化层来降低维度，以及全连接层进行分类。CNN的核心组成部分包括： 1. **卷积层**：卷积层是CNN的基础，它使用可学习的滤波器（权重）对输入图像进行扫描，生成特征映射。滤波器的滑动过程可以检测到图像中的局部模式，如边缘、线条和颜色。 2. **激活函数**：如ReLU（Rectified Linear Unit），它在神经网络中引入非线性，使得模型能学习更复杂的特征。 3. **池化层**：如最大池化或平均池化，用于减小数据的空间尺寸，减少计算量，并保持模型的泛化能力。 4. **归一化层**：如批归一化或局部响应归一化，用于加速训练，提高模型稳定性。 5. **丢弃层**：随机丢弃一部分神经元以防止过拟合，增加模型的泛化能力。 6. **全连接层**：将前一层的所有节点连接到输出层，用于分类任务。在“cnn_train_dag.m”这个MATLAB脚本中，我们可能会看到以下内容： 1. **数据预处理**：这通常包括图像的缩放、归一化、填充，以及对缺失值（thrownaqr_train）的处理。处理缺失值可能是通过填充零、使用均值或中位数等方法。 2. **构建CNN架构**：定义网络的层结构，包括卷积层、池化层、激活函数、全连接层等。 3. **损失函数和优化器选择**：如交叉熵作为损失函数，优化器可能选用Adam、SGD（随机梯度下降）等。 4. **训练流程**：设置训练参数，如学习率、批次大小、训练轮数，然后调用MATLAB的`trainNetwork`函数进行训练。 5. **模型验证与测试**：使用验证集监控模型性能，最终在测试集上评估模型的泛化能力。 6. **保存和加载模型**：训练完成后，模型权重可能被保存为`.mat`文件，便于后续使用或继续训练。 7. **可视化工具**：可能使用MATLAB的`plotTrainingHistory`或其他工具来展示训练过程中的损失和准确率变化。 8. **超参数调整**：为了获得最佳性能，可能需要通过网格搜索或随机搜索等方法调整超参数。这个项目提供了CNN模型训练的实践经验，涵盖了从数据预处理到模型构建、训练、评估和优化的全过程。通过分析和理解“cnn_train_dag.m”脚本，我们可以深入学习和掌握CNN的工作原理及其在实际问题中的应用。

资源推荐

资源详情

资源评论

收起资源包目录

cnn_train_dag.rar （1个子文件）

cnn_train_dag.m 15KB

function [net,stats] = cnn_train_dag(net, imdb, getBatch, varargin) %CNN_TRAIN_DAG Demonstrates training a CNN using the DagNN wrapper % CNN_TRAIN_DAG() is similar to CNN_TRAIN(), but works with % the DagNN wrapper instead of the SimpleNN wrapper. % Copyright (C) 2014-16 Andrea Vedaldi. % All rights reserved. % % This file is part of the VLFeat library and is made available under % the terms of the BSD license (see the COPYING file). addpath(fullfile(vl_rootnn, 'examples')); opts.expDir = fullfile('data','exp') ; opts.continue = true ; opts.batchSize = 256 ; opts.numSubBatches = 1 ; opts.train = [] ; opts.val = [] ; opts.gpus = [] ; opts.prefetch = false ; opts.epochSize = inf; opts.numEpochs = 300 ; opts.learningRate = 0.001 ; opts.weightDecay = 0.0005 ; opts.solver = [] ; % Empty array means use the default SGD solver [opts, varargin] = vl_argparse(opts, varargin) ; if ~isempty(opts.solver) assert(isa(opts.solver, 'function_handle') && nargout(opts.solver) == 2,... 'Invalid solver; expected a function handle with two outputs.') ; % Call without input arguments, to get default options opts.solverOpts = opts.solver() ; end opts.momentum = 0.9 ; opts.saveSolverState = true ; opts.nesterovUpdate = false ; opts.randomSeed = 0 ; opts.profile = false ; opts.parameterServer.method = 'mmap' ; opts.parameterServer.prefix = 'mcn' ; opts.derOutputs = {'objective', 1} ; opts.extractStatsFn = @extractStats ; opts.plotStatistics = true; opts.postEpochFn = [] ; % postEpochFn(net,params,state) called after each epoch; can return a new learning rate, 0 to stop, [] for no change opts = vl_argparse(opts, varargin) ; if ~exist(opts.expDir, 'dir'), mkdir(opts.expDir) ; end if isempty(opts.train), opts.train = find(imdb.images.set==1) ; end if isempty(opts.val), opts.val = find(imdb.images.set==2) ; end if isscalar(opts.train) && isnumeric(opts.train) && isnan(opts.train) opts.train = [] ; end if isscalar(opts.val) && isnumeric(opts.val) && isnan(opts.val) opts.val = [] ; end % ------------------------------------------------------------------------- % Initialization % ------------------------------------------------------------------------- evaluateMode = isempty(opts.train) ; if ~evaluateMode if isempty(opts.derOutputs) error('DEROUTPUTS must be specified when training.\n') ; end end % ------------------------------------------------------------------------- % Train and validate % ------------------------------------------------------------------------- modelPath = @(ep) fullfile(opts.expDir, sprintf('net-epoch-%d.mat', ep)); modelFigPath = fullfile(opts.expDir, 'net-train.pdf') ; start = opts.continue * findLastCheckpoint(opts.expDir) ; if start >= 1 fprintf('%s: resuming by loading epoch %d\n', mfilename, start) ; [net, state, stats] = loadState(modelPath(start)) ; else state = [] ; end for epoch=start+1:opts.numEpochs % Set the random seed based on the epoch and opts.randomSeed. % This is important for reproducibility, including when training % is restarted from a checkpoint. rng(epoch + opts.randomSeed) ; prepareGPUs(opts, epoch == start+1) ; % Train for one epoch. params = opts ; params.epoch = epoch ; params.learningRate = opts.learningRate(min(epoch, numel(opts.learningRate))) ; params.train = opts.train(randperm(numel(opts.train))) ; % shuffle params.train = params.train(1:min(opts.epochSize, numel(opts.train))); params.val = opts.val(randperm(numel(opts.val))) ; params.imdb = imdb ; params.getBatch = getBatch ; if numel(opts.gpus) <= 1 [net, state] = processEpoch(net, state, params, 'train') ; [net, state] = processEpoch(net, state, params, 'val') ; if ~evaluateMode saveState(modelPath(epoch), net, state) ; end lastStats = state.stats ; else spmd [net, state] = processEpoch(net, state, params, 'train') ; [net, state] = processEpoch(net, state, params, 'val') ; if labindex == 1 && ~evaluateMode saveState(modelPath(epoch), net, state) ; end lastStats = state.stats ; end lastStats = accumulateStats(lastStats) ; end stats.train(epoch) = lastStats.train ; stats.val(epoch) = lastStats.val ; clear lastStats ; saveStats(modelPath(epoch), stats) ; if opts.plotStatistics switchFigure(1) ; clf ; plots = setdiff(... cat(2,... fieldnames(stats.train)', ... fieldnames(stats.val)'), {'num', 'time'}) ; for p = plots p = char(p) ; values = zeros(0, epoch) ; leg = {} ; for f = {'train', 'val'} f = char(f) ; if isfield(stats.(f), p) tmp = [stats.(f).(p)] ; values(end+1,:) = tmp(1,:)' ; leg{end+1} = f ; end end subplot(1,numel(plots),find(strcmp(p,plots))) ; plot(1:epoch, values','o-') ; xlabel('epoch') ; title(p) ; legend(leg{:}) ; grid on ; end drawnow ; print(1, modelFigPath, '-dpdf') ; end if ~isempty(opts.postEpochFn) if nargout(opts.postEpochFn) == 0 opts.postEpochFn(net, params, state) ; else lr = opts.postEpochFn(net, params, state) ; if ~isempty(lr), opts.learningRate = lr; end if opts.learningRate == 0, break; end end end end % With multiple GPUs, return one copy if isa(net, 'Composite'), net = net{1} ; end % ------------------------------------------------------------------------- function [net, state] = processEpoch(net, state, params, mode) % ------------------------------------------------------------------------- % Note that net is not strictly needed as an output argument as net % is a handle class. However, this fixes some aliasing issue in the % spmd caller. % initialize with momentum 0 if isempty(state) || isempty(state.solverState) state.solverState = cell(1, numel(net.params)) ; state.solverState(:) = {0} ; end % move CNN to GPU as needed numGpus = numel(params.gpus) ; if numGpus >= 1 net.move('gpu') ; for i = 1:numel(state.solverState) s = state.solverState{i} ; if isnumeric(s) state.solverState{i} = gpuArray(s) ; elseif isstruct(s) state.solverState{i} = structfun(@gpuArray, s, 'UniformOutput', false) ; end end end if numGpus > 1 parserv = ParameterServer(params.parameterServer) ; net.setParameterServer(parserv) ; else parserv = [] ; end % profile if params.profile if numGpus <= 1 profile clear ; profile on ; else mpiprofile reset ; mpiprofile on ; end end num = 0 ; epoch = params.epoch ; subset = params.(mode) ; adjustTime = 0 ; stats.num = 0 ; % return something even if subset = [] stats.time = 0 ; start = tic ; for t=1:params.batchSize:numel(subset) fprintf('%s: epoch %02d: %3d/%3d:', mode, epoch, ... fix((t-1)/params.batchSize)+1, ceil(numel(subset)/params.batchSize)) ; batchSize = min(params.batchSize, numel(subset) - t + 1) ; for s=1:params.numSubBatches % get this image batch and prefetch the next batchStart = t + (labindex-1) + (s-1) * numlabs ; batchEnd = min(t+params.batchSize-1, numel(subset)) ; batch = subset(batchStart : params.numSubBatches * numlabs : batchEnd) ; num = num + numel(batch) ; if numel(batch) == 0, continue ; end inputs = params.getBatch(params.imdb, batch) ; if params.prefetch if s == params.numSubBatches batchStart = t + (labindex-1) + params.batchSize ; batchEnd = min(t+2*params.batchSize-1, numel(subset)) ; else batchStart = batchStart + numlabs ; end nextBatch = subset(batchStart : params.numSubBatches * numlabs : batchEnd) ; params.getBatch(params.imdb, nextBatch) ; end if strcmp(mode, 'train') net.mode = 'normal' ; net.accumulateParamDers = (s ~= 1) ; net.eval(inputs, params.derOutputs, 'holdOn', s < params.numSubBatches) ; else

评论收藏

内容反馈

版权申诉