没有合适的资源?快使用搜索试试~ 我知道了~
有界扰动下约束非线性系统鲁棒经济模型预测控制.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 86 浏览量
2023-02-23
16:50:17
上传
评论
收藏 1.43MB DOCX 举报
温馨提示
试读
14页
有界扰动下约束非线性系统鲁棒经济模型预测控制.docx
资源推荐
资源详情
资源评论
行人重识别指跨监控设备下的行人检索问题, 在公共安全、智能监控等领域具有广泛
的应用. 具体而言, 给定一张行人图片, 行人重识别用来在其他摄像头拍摄的大型图片库中
找出该行人的图片. 由于监控图片的分辨率低, 且不同的图片之间存在光照、姿态、摄像头
视角等方面的差异, 行人重识别目前仍是一个很有挑战性的问题.
1. 相关研究
早期行人重识别的研究思路通常是先对行人图片提取手工特征, 如颜色直方图、方向
梯度直方图(Histogram of oriented gradient, HOG)
[1]
等, 然后使用相似性度量方法, 如大边界
最近邻算法(Large margin nearest neighbor, LMNN)
[2]
、交叉二次判别分析算法(Cross-view
quadratic discriminant analysis, XQDA)
[3]
等来学习度量矩阵. 为了克服光照、成像条件等因
素影响, 采用多特征分析是常用的一种方式
[4-6]
. 随着深度学习技术的兴起, 深度学习广泛应
用于行人重识别任务中. 目前, 基于深度学习的行人重识别方法在性能上大大超过了传统方
法
[7]
, 主要有如下两个原因: 1) 手工设计的特征描述能力有限, 而深度学习使用深度卷积神
经网络可以自动学习出更复杂的特征; 2) 深度学习可以将特征提取和相似性度量联合在一
起, 实现端到端的学习, 从而得到全局最优解.
目前基于深度学习的行人重识别方法主要分为度量学习和表征学习方法
[8]
. 度量学习
通过设计不同的度量损失来约束特征空间, 使得同一个行人的不同图片在特征空间上距离
很近, 而不同行人的距离很远, 如三元组损失(Triplet loss)
[9]
、四元组损失(Quadruplet loss)
[10]
和群组相似性学习(Group similarity learning)
[11]
等方法. 这类方法的关键在于样本对的选取,
由于大量样本对简单易于区分, 随机采样将会导致网络的泛化能力有限, 因而需要挑选出一
些难样本对进行训练. Zhu 等
[12]
对困难和简单的负样本设计不同的目标函数来学习距离度量
方法, 以充分利用负样本中的信息. 相对于表征学习, 度量学习的训练时间更长, 收敛也更
困难. 因此, 表征学习方法得到了更加广泛的研究.
表征学习方法在训练网络时将行人重识别当作身份分类任务来学习行人特征, 关键问
题是如何设计网络以学习到更具有判别力的特征. Sun 等
[13]
根据人体结构的先验知识, 在垂
直方向上对特征图均匀分块, 然后提取每个区域的局部特征. 还有一些方法利用额外的语义
信息, 例如骨骼关键点、分割结果等, 定位行人的各个部位. Su 等
[14]
借助关键点检测模型对
人体区域定位、裁剪、归一化后, 拼接成新的图片作为网络的输入. Sarfraz 等
[15]
将行人 14
个关键点的位置响应图和原图片一起输入到网络中, 让网络自动地学习对齐. Kalayeh 等
[16]
在 LIP (Look into person)
[17]
数据集上训练人体解析模型来预测 4 个人体部位和背景, 然后在
特征图上提取这些部位的特征.
由于不同的行人可能具有相似的外观, 而同一个行人在不同的环境下存在很大差异,
只从全局外观的角度无法进行正确匹配. 行人的属性, 例如性别、是否背包、头发长短等,
包含丰富的语义信息, 可以为行人重识别提供关键的判别线索. 早期的研究中, Layne 等
[18]
手工标注了 15 种语义属性来描述行人, 包括性别、服装种类、是否携带物品等, 并使用支
持向量机(Support vector machine, SVM)训练属性分类器, 最后与底层特征融合得到行人图
像的最终特征描述. 随着深度学习的广泛应用, Zhu 等
[19]
在一个卷积神经网络中同时预测多
个属性, 在 PETA (Pedestrian attribute)
[20]
数据集上的属性识别性能明显优于基于 SVM 的方
法. Schumann 等
[21]
先在 PETA 数据集上训练属性识别模型, 然后在行人重识别模型中利用
属性预测的结果, 使得网络可以学习到与属性互补的特征. 该方法分开训练两个网络, 无法
充分利用属性标签和身份标签, 导致行人重识别的性能比较低. Lin 等
[22]
在行人重识别数据
集 DukeMTMC-reID
[23]
和 Market1501
[24]
上标注了行人属性, 并提出 APR (Attribute-person
recognition)模型实现行人重识别和属性识别的多任务学习, 同时将属性预测的结果和全局
特征一起用于行人重识别任务. 该方法使用属性的预测结果, 当属性识别错误时, 会给行人
重识别引入噪声. Tay 等
[25]
提出了 AANet (Attribute attention network), 将行人属性和属性的
激活区域图集成到分类网络中来解决行人重识别问题, 得到了比较好的检索结果. 上述方法
同等对待所有属性, 忽略了每个属性对每张图片的重要性是不同的.
针对以上问题, 本文提出了融合属性特征的行人重识别方法, 主要工作如下: 1) 将行
人重识别和属性识别集成到分类网络中进行端到端的学习; 2) 为了减小属性识别错误对行
人重识别的影响, 从特征的角度利用属性信息; 3) 自适应地生成对应于每个属性的权重, 并
将所有属性特征以加权求和的方式结合起来, 与全局特征一起用于行人重识别任务. 在
DukeMTMC-reID 和 Market-1501 数据集上的实验结果表明了本文方法的有效性.
2. 融合属性特征的行人重识别模型
图 1 为本文的网络结构图, 前半部分为提取图片特征的主干网络, 后半部分分为身份
分类、属性识别和属性特征融合三个分支. 身份分类分支对行人的全局特征进行身份的预
测; 属性识别分支用来预测行人的各个属性; 属性特征融合分支首先以自适应的方式对属
性特征加权求和, 得到融合后的属性特征, 然后对该特征进行身份预测.
图 1 网络结构示意图
Fig. 1 Schematic diagram of network structure
下载: 全尺寸图片 幻灯片
2.1 主干网络结构
使用 ResNet-50 作为主干网络提取图片的特征. ResNet-50 包含 1 层卷积层(conv1)和 4
个残差模块(conv2 ~ conv5), 每个残差模块包含多层卷积层、批量规范化层和线性整流激活
函数(Rectified linear units, ReLU). 文献[26]提出多个相关性低甚至相反的任务一起学习时,
在共享参数上会产生相互竞争甚至相反的梯度方向, 从而影响所有任务的学习. 为了减轻任
务间的干扰, 在 ResNet-50 的第 4 个模块 conv4 后将网络分成两个分支, 分别学习行人的全
局特征和属性特征, 即两个分支中 conv5 模块的参数不共享. 根据文献[13], 本文去除了两
个分支的 conv5 模块中的下采样操作, 以增加特征图的大小、丰富特征的粒度. 将大小为
256×256×128128 像素的图片输入网络时, 可以从 conv5 模块输出大小为 16×816×8 的特征
图.
设 S={(x1,y1,a1),⋯,(xn,yn,an)}S={(x1,y1,a1),⋯,(xn,yn,an)}为训练数据集, 其中 nn 是图
片的张数, xixi 表示第 ii 张图片, yi∈{1,2,⋯,N}yi∈{1,2,⋯,N}表示该图片的身份标签, NN 是训
练集中行人的个数, ai=[a1i,a2i,⋯,aMi]∈RMai=[ai1,ai2,⋯,aiM]∈RM 表示这张图片的属性标
剩余13页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3542
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功