论文研究-基于卷积神经网络的目标检测算法 .pdf

所需积分/C币:45 2019-08-19 18:12:36 791KB .PDF
421
收藏 收藏
举报

基于卷积神经网络的目标检测算法,夏源,张洪刚,本文是基于卷积神经网络的目标检测学习算法,与传统的物体检测算法不同,基于深度学习的目标检测算法,可以通过从海量数据中自动
山国武花论文在丝 当和合并成,区域的颜色分布直方图可以用下面式子进行计算: 选择性搜索意在找岀可能的目标位置来进行物体的识别。与传统的单一策略相比,选择 性搜索提供了多和策略,并且与蛮丿搜索相比,人幅度降低搜索空间,让我们可以用到更好 的识别算法。现实中,很多图像是包含多类别,多层次的信息的,所以我们使用到多层分割 的方法,并且使用多种分割策略。 卷积神经网络 卷积神经网络是多层感知机的一个变种模型,我们知道在视觉皮层存在一种细胞的复 杂分布,这些细胞对于外界的输入局部是很敏感的,它们被称为“感受野”(细胞),它们 以某种方法来覆盖整个视觉域。这些细胞就像一些滤波器一样,它们对输入的图像是局詺敏 感的,因此能够更好地控掘出自然图像中的日标的空间关系信息。 卷积神经网络的特性 稀疏连接和权值共亨是卷积神经网络两大特性。稀疏连接,卷积神经网络通过加强神经 网络中相邻层之间节点的局部连接模式( )来挖掘自然图像的空间 局部关联信息。当前层节点与前一层的节点的局部子集,具有空间连续视觉感受野的节点相 权值共亨,在卷积袢经网络中,每一个稀疏滤波器在整个感受野中是重复叠加的,这些 重复的节点形式了一科特征图( ),这个特征图可以共享相同的参数,比如相同 的权值知阵和偏置向量。在这里,梯度下降算法仍然可以用来训练这些共享的参数,只需 要在原算法的基砒上稍作改动即可。共享权重的梯度可以对共享参数的梯度进行简单的求和 得到。此外,权值共享提供了一种高效的算法实现方式,因为这种方式大大減少了需要训练 的参数。通过控制卷积神经网络模型的睿量,卷积神经网络在解决计算机视觉问题上有更好 的泛化能力。 卷积神经网终特征提取 为了更加清晰的看到,神经网络可以学习到边缘特征,我们通过一个测试的卷积神经网 终模型,根据第一层所学习到的参数来可视化学习到的边缘特征。 227×227 7×27 步长 55X55 输入层 卷积层 池化层卷积层池化层 全连接层 图基于目标检测系统框图 山国武花论文在丝 图为卷积神经网络架构图。对」每个区域检测窗,我们使用 卷积神经 网络通过 提取维的特征向量。学习到的特征如图所示。一幅×的 图像先通过均值相减,之后通过卷积神经网络前向传播,神经网络包括个卷积层和个全 连接层。 图卷积神经网络特征提取图 为了计算一个区域检测窗的特征,我们首先需要把图像信息转换成与卷积神经网络相符 合的形式。因为卷积神经网络的架构需要×的固定输入。对于各种可能的变形方式, 我们选择最简单的方法。我们裁剪候选窗到特定的大小,并不考虑区域检测窗的大小和比例。 但是在裁剪之前,我们先扩大裁剪窗,因此,在每一个窗口周围有像素的扩展,保留了一定 的上下文信息。 其中 +,和分别为砷经网络的连接参数和偏置。 传统的神经元模型使用的激活函数是,它是从神经科学上边伤生过来的,用它 来模拟神经元从受到灲激,接收到的电信号超过一定的阈值就产生兴奋这个特性确实是很恰 当的。然而它有一个严重的问题就是其容易产生饱和效应,也称梯度弥散效应,就是在 函数的两侧是平的,即梯度非常小,在个深层的神经网络模型中,有很多神经元 的都是在这个函数的两边,这就使得梯度累加起米的和在反向传播的过程中会越來越小。实 验表明,梯度确实会越米越小,导致前边几层根本无法得到有效地训练。 为了解决传统的激活函数饱和效应的问题,近年来提出了 和 公式如下: + 叮以发现, 的公式实际上|分简单,类似绝对值的函数一方面解决了饱和 问题,方面对于负薮区间的截断,定程度上增加了参数的稀疏性 山国武花论文在丝 支持向量机 支持向量机算法的基本思想是根据 提出的原理,通过最大化分类间隔或边 缘尽量提高学习机的泛化性能。这使得法比基于经验风险最小化的学习方法 具有更好的泛化能力。支持向量机核心是,通过求解一个最优化问题来找到最大分类间 隔。具有软间隔的最优化问题定义如下 一般带约束条件的凸优化问题,通过米用拉格朗日求解其对偶问题来解决。可以证明, 在满足条件的情况下,原问题可以转为对偶问题: C 对偶形式可以通过算法求解 模型训练 模型预训练 本文在进行目标检测训练之前,先使用一个大型数据集预先训练卷积神经网络,这个预 训练仅仅是图像级别的标注(即没有 的信息)。预训练山 提供的卷积神 经网络库实现 模型微调 为了使我们的卷积神经网络适应新的任务(目标检测)和新的区域(裁剪过的区域检测 窗)。我们继续使用随机梯度下降法训练卷积神经网络的参数,仅仅使用栽剪的区域检测窗 除了将 的分类转换为目标检测的分类,总体的卷积神经网络的架构并没 有改变。对于 对于 。如果区域检测窗与 检测窗重合度人于,则将类别设为 的类别。 训练开始时,我们把随机梯度下降的学习速率设置为(初始预训练学习速率的 ),这样是为了微调能够顺利进行而不扰乱初始的参数。在每一次随机梯度下降的迭代 过程中,我们均匀的采样个正米样窗(对于每一个类别)和个背景窗做负样本,这样 构建一个大小为的之所以正负样木采样不均,是因为正样木比起负样木确实很 目标分类 我们来考虑一个二元分类器来检测汽车,如果图像区域紧紧包闱汽车,很明显则认为是 一个正样本。同样的,对于背景区域(不包含汽车),则应该认为是负样本。对于某些部分 山国武花论文在丝 与汽车重叠的区域,则需要通过定的方法来标注。我们用窗∏重叠度来划分负样本,低于 阈值的为负样本。我们通过网格搜索法在 的区间在父叉验证集上搜索阈值 最终确定阈值为。实验发现,这个阈值很重要,如果把亡设置为,则最终结果平均准 确率下降。由此得到的正样本,将作为每一类 的包围窗。 这样我们得到特征向量和训练标签,我们对每一类用支持向量机训练。因为训练数据太 大,无法存入内存,我们采用标准的 的方法。 的方 法收敛很快,平均准确率仅在一次迭代仝部图片后停止增加。 在微调阶段,我们把日标与 有最大重合度(与其他类别比较)的设为该类 正样本,前提是重合度大于其他区域检测窗是负样本(对于所有类别的负样本)。在 训练支持向量机阶段,我们仅仅认为 为该类正样本,其他区域检测窗与其重合 度小于为该类负样本。我们忽咯了灰色区域的检测窗(对于重合度大 但非 的区域检测窗) 目标检测 在测试阶段,我们在待检测图片上运行选择性搜索生成约个区域检测窗。我们裁 剪每一个区域检测窗,然后前向传播通过卷积神经网络来计算特征。之后,对于每一个类别, 我们使用训练好的文持向量机为提取的特祉向量打分。对」所有打分的区域窗,我们采用非 极大值抑制(每一个类别独立使用)来处理重复窗口。如果这个区域和一个更高得分的区域 重合度大于所选阈值,则拒绝该窗冂。 对测试阶段进行分析,我们发现算法冇两个特性使得检测是高效的。第一,卷积神经网 终的参数是仝类別共享的。第二,相比其他方法,比如空间金字塔视觉词袋模型,由卷积神 经网终计算出来的特征向量是相对低维的。 这些参数共享的结构导致计算区域检测窗和特{向量是均摊在每一个类别的。因此,唯 与特定类别相关的计算主要在于矩阵和冋量的内积(特征冋量与支持向量机参数的内积) 和非极大值抑制。实践中,对于一张输入图片,产生约个区域检测窗,所有的点积被 转换为一个矩阵与矩阵的乘法特征矩阵是×维度,支持向量机的参数矩阵是 ×,这里是类别总数。分析表明 可以扩展到上千级别的分类,而不借助」其他 方法。即便是对于万类别,在台现在的多核电脑上,矩阵的相乘也只需要秒 左右。效率的提高不仅是区域检测窗和共享特征。 在 的最佳参数配置下,我们在 使用交叉验证的方法来确定 超参数。在最后 的结果上,我们用 来微调卷积神经网终,用 来最优化支持向量机检测器,其中参考了 的方法。我们对比了两种方 法,一种是传统的基于 模型,另一种是系统。与我们最相关的是 系统,因我们使用同样的区域检测算法。 系统为了对区域分类,建立一个层的空间 金字塔,然后传入密集采样的 特征描述」,每 个向量被量化成维的字典。分类由直方图交叉核支持向量机完成。相比系统的 多特征、非线性核文持向量机,我们的系统准确率更高、速率更快 实验结果与分析 为验证基于卷积神经网终标检测算法的性能,本节将对比祿积神经网絡算法与传统基 检测算法的检测结果以及正确率。最后分析实验结果,做岀性能评价。 山国武技论文在丝 实验配置 实验从 数据集的类物体中选取飞机、自行车、猫、狗、小轿车、 人六类模型,每类模型选取张图片测试。 日标检测均在以下测试环境下进行: 内存: 操作系统: 检测结果 (a)狗 (b)人物 250 8.. ()猫 (d)飞机 (e)汽车 (f)自行车 图基于目标检测算法效果图 图是·些选自 数据集的测试图片,可以看出基于卷积神经网络的目标 检测算法具有较髙的准确率。下面来根据沨试图片来分析结果。分别是检测系统对狗、 人、猫、飞机、小轿玍和自行车的检测结果。每张图的主伓内容均检测正确,可以发现区域 山国武花论文在丝 检测窗与目标主体基本重合。 从 可以看岀,基于卷积神经网络的模型在多目标检测也有很好的效果 的主体是狗,但可以发现我们的算法可以把边角遮挡的自行车检测出米,这说明卷积神经网 终模型能冇效解决遮挡问题,的主伓是人,但是我们的模型可以把杗上的瓶子检测出来, 这说明算法在复杂背景下也能正确检测目标,可以看出小孩和自行车都能破检测出来。从 和可以看出,一幅图中同一类别多个物体,我们的算法可以检测出多个目标。对 于,主体是两辆小轿车,一辆是侧面,另一辆是正面而且部门被遮挡,即使在这种情况 ,我们的算法仍然能正确检测,可见算法对部分遮挡以及多视角问题也有一定的鲁棒性。 平均精度分析 图所示了从 数据集训练得到的行人模型的精度召回率曲线: ·=LSY-DM mAF:07195 mAP=O. 677a\ 06 好 0.4 0.2 2D.3 7033.3 召回衣 图两种算法下的精度召回率曲线和平均精度 表不同模型半均精度比较 检测目标 DPM-SVMI算法 CN算法 长机 0.65 0.68 自行车 0.69 0.72 猫 0.71 0.73 狗 ).68 0).70 小轿车 ).66 ).74 人 ).62 0).64 山国武技论文在丝 两种算法不同类别算法平均准确率(mAP) 076 0.71 0.66 ■LSM-DPM ■CNNs 0.61 056 飞机自行车猫狗小轿车人 图两种算法不同类别平均准确率 由表和图可以看出,任何一和检测目标下本文的算法都比传统 的正确 率要高,这是因为传统算法只是用传统的训练算法来进行定位,人工构造的特征存在局限性, 局限性梯度特征、边缘特征等,基于滁积神经网络提取的特征,既有局部连接,保证图像局 部特征,又因为权佰共享,所以又能保证图像的仝局特征。因此,平均准确率要髙于传统的 方法。 总结 本文给出了一和基于卷积神经网终目标检测算法,与传统的物体检测算法不冋,基于深 度学习的目标检测算法,可以通过从海量数据中自动学习特征,其次,基于卷积神绎网络的 特征提取,可以大大减少特征的维数。同时,由于对每一类别的日标檢测,卷积神经网络的 参数是相同,这样可以减少参数,提高运算效率。经实验证明,该算法在发生形变、存在遮 挡及目标受十扰下定位困难的问题,具有准确率高、鲁棒性好、检测速率快等优点,具冇较 强的实际应用价值 参考文献 黄凯奇仟伟强谭铁作图像物体分类与检测算法综述计算机学报 期 山国武技论文在丝

...展开详情
试读 10P 论文研究-基于卷积神经网络的目标检测算法 .pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-基于卷积神经网络的目标检测算法 .pdf 45积分/C币 立即下载
1/10
论文研究-基于卷积神经网络的目标检测算法 .pdf第1页
论文研究-基于卷积神经网络的目标检测算法 .pdf第2页

试读结束, 可继续读1页

45积分/C币 立即下载 >