没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
在全景视频目标跟踪过程中,由于光照条件变化复杂和目标相对镜头运动时尺度变化剧烈,目标跟踪算法存在精度低和适用性差等问题。为了解决这个问题,提出了一种基于改进SiameseRPN的全景视频目标跟踪算法。首先采用MobileNetV3中的网络结构提取深度特征,使算法对全景视频序列中出现的场景缺陷有更好的适应性,并利用Squeeze and Excite模块增加网络对特征选择的敏感度。提出并构建了一种基于双线性插值的特征融合模块,运用双线性插值的方法使输出的后三层深度特征具有相同尺度,并融合这三层特征以用于网络预测。最后利用分类分支预测出当前序列中的正负样本,利用回归分支预测当前输出目标的位置信息和尺度信息,最终输出目标的位置信息。实验结果表明:所提算法可以有效地解决全景数据中的局部图像质量欠佳和尺度变化的问题,在保持实时跟踪性能的同时,具有较高的跟踪精度,对目标跟踪中出现的小目标、目标遮挡及多目标交叉运动等情况表现出良好的适应性,具有良好的视觉效果和较高的跟踪得分。
资源推荐
资源详情
资源评论
第
卷
第
期
激 光 与 光 电 子 学 进 展
年
月
一种基于改进
SiameseRPN
的全景视频目标
跟踪算法
王 殿 伟
,
方 浩 宇
,
刘 颖
,
姜 静
,
任 新 成
,
许 志 杰
,
覃 泳 睿
西安邮电大学通信与信息工程学院
陕西 西安
延安大学物理与电子信息学院
陕西 延安
哈德斯菲尔德大学计算机与工程学院
英国
摘要
在全景视频目标跟踪过程中
由于光照条件变化 复杂 和 目标 相对 镜 头运 动时 尺 度变 化剧 烈
目 标跟 踪算 法
存在精度低和适用性差等 问题
为 了 解决 这 个 问 题
提 出 了一 种 基 于 改 进
的 全 景 视 频 目 标 跟 踪 算
法
首先采用
中的网络结构提取深度特征
使算法对全景视频序列中出现的场景缺陷 有更 好的适 应
性
并利用
模块增加网络对特 征选 择的 敏 感度
提 出并 构建 了 一种 基于 双 线性 插值 的 特征 融
合模块
运用双线性插值的方法使输出的后三层深 度特 征具 有 相同 尺度
并 融合 这三 层 特征 以用 于 网络 预测
最
后利用分类分支预测出当前序列中的正负样本
利用回 归分 支 预测 当前 输 出目 标的 位 置信 息和 尺 度信 息
最 终输
出目标的位置信息
实验结果表明
所提 算 法可 以 有 效 地解 决 全 景 数据 中 的 局 部图 像 质 量 欠佳 和 尺 度 变化 的 问
题
在保持实时跟踪性能的同时
具有较高的跟踪精 度
对 目标 跟踪 中 出现 的小 目 标
目 标遮 挡及 多 目标 交叉 运 动
等情况表现出良好的适应性
具有良好的视觉效果和较高的跟踪得分
关键词
图像处理
目标跟踪
深度学习
全景视频
中图分类号
文献标志码
doi
Al
g
orithm
for
Panoramic
Video
Trackin
g
Based
on
Im
p
roved
SiameseRPN
School
o
f
Communications
and
In
f
ormation
En
g
ineerin
g
Xi
an
Universit
y
o
f
Posts
and
Telecommunications
Xi
an
Shaanxi
China
School
o
f
Ph
y
sics
and
Electronic
In
f
ormation
Yan
an
Universit
y
Yan
an
Shaanxi
China
School
o
f
Com
p
utin
g
and
En
g
ineerin
g
Universit
y
o
f
Hudders
f
ield
Hudders
f
ield
HD
DH
UK
Abstract
收稿日期
:
修回日期
:
录用日期
:
基金项目
:
公安部科技强警基础研究专项
陕西 省自 然科学 基础 研究计 划
陕西 省能 源
大数据智能处理省市共建重点实验室开放基金
E-mail
E-mail
激 光 与 光 电 子 学 进 展
Ke
y
words
OCIS
codes
引
言
目标跟踪 算 法 是 根 据 视 频 序 列 中 给 定 的 第 一
帧目标位置 信 息 来 估 计 之 后 视 频 帧 中 同 一 目 标 的
位置与尺度 信 息
在 智 能 监 控
交 通 系 统 和 人 机 交
互等领域均有广 阔的应用 前 景
受运动模 糊
背景
相似干扰
遮 挡
光 照 变 化 和 尺 度 变 化 等 因 素 的 影
响
目标跟踪算法精度 低
适用性差
因此
如何提
高目标跟踪算法的鲁棒性和准确性是一项挑战
全景图像具有较大的 视 野范围
较多的场 景 信
息和较高的分辨率
同时也伴 随 着较大的 计 算量和
较高的目 标 区 分 复 杂 度
尤 其 是 当 目 标 与 全 景 相
机的距离发生较大变化时
全景视频 内 目标尺度 和
形状的变化非常大
目前
针对单目 视 频的目标
跟踪算法在全景视频下难 以 应对这种 变 化
容易出
现目标丢失的情况
因此开展 全 景视频目 标 跟踪算
法的研究具有重要的意义
而提高算 法 的跟踪精 度
和稳健性是亟需解决的问题
深度学习 是 近 些 年 来 人 工 智 能 领 域 的 研 究 热
点之一
卷积神经网络有 强 大的特征 表 征能力
在
提取特征方面具有较大优 势
因此被广 泛 应用于目
标 跟 踪 领 域
等
提 出 了
模 型
这
是一种新颖的卷积神经网 络 架构
其将共用 信 息与
特定信息分开
利用 从深度网 络 中提取的 多 维特征
进行模型参数的反向更新
并学习用 于 目标跟踪 的
通用特征表示
等
通过结合有监督学习和强
化学习
提出了
算法
该算 法 采 用 有 监 督 学 习 训 练 网 络 跟 踪 目 标
通过强化学习预测目标的 状 态及动作
较好地解 决
了目标跟踪过程中目标尺 度 变化的问 题
但算法精
度不 佳
等
在
的 基 础 上 提 出
通 过 改 进 损 失 函 数 并 采 用 自 适 应 的
层
简化 了 多 域 网 络 结 构
在 保 持 跟 踪 精
度基本不变的情况下将运算速度提升了近
倍
但
是该算法缺少尺度变化模 块
无法直接 应 用于全景
视频图像的目标跟踪
是谷歌提出
的轻量级神经网络
其利用空 洞 卷积显著 减 少了网
络参 数
在 移 动 端 中 的 准 确 率 较 高
等
将
与 区 域 生 成 网 络
结合
提 出 了
解 决 了
尺度不能变化的问题
并利用相关 滤波
的方法取得了 很 高 的 准 确 率
同 时 保 持 了 实 时 性
但该算法容易受相似特征背景的干扰
针对 上 述 问 题
本 文 提 出 了 一 种 基 于 改 进
网络的目标跟 踪 算 法
将
替
换为可以利 用更深层 特 征的
并 使 用
深层特征 来 训 练 网 络 以 降 低 背 景 的 干 扰
该 算 法
在
的网 络 结 构 中 提 取 了 多 层 间 的 特
征
通过双线性 插 值 来 增 大 网 络 的 特 征 输 出
然 后
将回归和分类后的特征进 行 加权融合
加强了网 络
鲁棒性
实验结果表明
本文算法 显 著提高了 跟 踪
精度
保持了实 时 的 运 算 速 度
能 够 解 决 全 景 图 像
目标跟踪的尺度变化和局部欠曝光问题
全景视频的目标跟踪
21
全景数据
全景视频 的 可 视 范 围 大
没 有 视 野 盲 区
在 固
定场景的目标跟踪过程中
目标再识 别 时不易出 现
特征损失
全 景 视 频 是 由 七 目 相 机 拍 摄 的 视 频 拼
接而成 的
全 景 相 机 中 不 同 摄 像 头 的 曝 光 程 度 不
同
视频拼 接 时 会 发 生 过 曝 光 或 者 欠 曝 光 的 情 况
这对全景 图 像 局 部 特 征 会 产 生 较 大 的 影 响
当 目
标对象与摄像头相对运动 时
距离的变 化 在全景图
像中会以尺 度 变 化 的 方 式 表 现 出 来
距 离 越 近
这
种尺度变 化 程 度 越 严 重
全 景 视 频 中 目 标 尺 度 变
化的过程如图
所示
图
截取了全景视频 中 目标运动 的 变化
矩形
框表示目标位置的真实值
在目标由 远 及近的过 程
中
出现了严重 的 尺 度 变 化 和 非 刚 体 形 变
一 般 基
于深度学习 的 目 标 跟 踪 算 法 对 尺 度 变 化 的 映 射 较
为简单
不 能 很 好 地 适 应 全 景 视 频 中 的 变 化 幅 度
全景图中出现的局部过曝光情况如图
所示
图
所示为七目摄像头拼接 的全景图
一个框
剩余10页未读,继续阅读
资源评论
weixin_38571878
- 粉丝: 5
- 资源: 935
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 5G模组升级刷模块救砖以及5G模组资料路由器固件
- C183579-123578-c1235789.jpg
- Qt5.14 绘画板 Qt Creator C++项目
- python实现Excel表格合并
- Java实现读取Excel批量发送邮件.zip
- 【java毕业设计】商城后台管理系统源码(springboot+vue+mysql+说明文档).zip
- 【java毕业设计】开发停车位管理系统(调用百度地图API)源码(springboot+vue+mysql+说明文档).zip
- 星耀软件库(升级版).apk.1
- 基于Django后端和Vue前端的多语言购物车项目设计源码
- 基于Python与Vue的浮光在线教育平台源码设计
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功