没有合适的资源?快使用搜索试试~ 我知道了~
基于道路场景理解的巡检机器人避障方法研究与应用.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 194 浏览量
2022-12-01
09:06:24
上传
评论
收藏 413KB DOCX 举报
温馨提示
试读
14页
基于道路场景理解的巡检机器人避障方法研究与应用.docx
资源推荐
资源详情
资源评论
1. 引言
近年来,随着人工智能和机器人技术的不断进步,作为机器人中重要组成部分之一的
巡检机器人也得到了长足的发展,被广泛应用于工业、农业、电力、航空航天、医疗等各
个领域
[1]
.对于巡检机器人而言,准确的导航避障是其顺利完成巡检任务的前提
[2]
.目前,大
多数巡检机器人主要利用测距传感器,如超声波
[3]
、激光雷达
[4]
等,结合避障算法来实现机
器人自主避障.尽管距离传感器获取的数据精度较高,但存在获取的信息稀疏、场景可理解
性差等局限,较大的限制该技术的进一步应用
[5]
.而随着图像处理技术的发展,基于视觉的
机器人避障方法研究逐渐成为了研究热点
[6]
.通过视觉方式可以获取丰富的场景信息,可以
更好的辅助机器人完成避障,但传统的基于视觉避障方法需要人工设计特征来对障碍物和
道路进行识别(如 HOG、SIFT、Haar 等),该方式需要较强的专业知识,且泛化能力和鲁棒
性都较差,在实际应用中效果也不理想
[7]
.因此,研究一种基于深度学习的视觉避障方法,
可以有效避免传统方法的弊端,并能充分利用道路环境信息,对巡检机器人智能化发展以
及实际落地应用都有较大的推进作用.
对于深度学习与巡检机器人结合的避障方法,大量学者从不同角度进行了深入的研
究,并取得了一系列成果.刘藏龙等人
[8]
基于 AlexNet 深度神经网络设计了一套端到端的机
器人避障方法,通过对输入图像训练学习来预测机器人转向命令,实现导航避障.鲜开义等
人
[9]
针对变电站道路场景,设计了一种联合图像分类和语义分割的网络,通过对道路场景
分类和语义分割后处理判断实现全局和局部导航避障.Singhani 等人
[10]
将语义分割网络与传
统边缘检测技术相结合,对机器人道路可行区域进行预测,并对可行区域生成 3D 点云指
导机器人实时导航.Jiayang 等人
[11]
针对医院道路场景,利用利用双向循环神经网络预测行人
轨迹,生成动态障碍物信息,并将动态障碍信息转化为全局信息与静态障碍信息进行融
合,进而实现避障.尽管目前已有较多方法将深度学习技术应用于道路场景理解实现机器人
避障,但由于深度网络的参数多、计算量大等问题使机器人避障效率较低.同时,大多数现
有方法也忽略了机器人导航避障时场景之间的关联性,使网络存在部分冗余计算.
2. 道路场景理解避障模型
2.1 整体框架
本文所搭建的基于道路场景理解的避障模型(RSUNet)整体结构如图 1 所示.
图 1 RSUNet 网络结构图
Figure 1. The structure diagram of RSUNet
下载: 全尺寸图片 幻灯片
该模型主要由三部分构成:场景理解主干网络、自适应控制结构以及可行区域分析模
块.场景理解主干网络主要由卷积、池化、激活、上采样等网络操作,以残差结构模式串联
堆叠构建而成,通过端到端的训练学习各目标特征,实现场景理解.自适应控制结构主要通
过对比前后两帧图像特征信息的差异大小,自主选择是否过滤部分网络层的计算,保障网
络计算的实时性(图中灰色和灰白色即为控制模块对应的控制部分).而可行区域分析模块主
要将场景理解后的图像信息转化为巡检机器人的控制指令,从而指导机器人实现自主避障.
2.2 场景理解主干网络
目前,基于深度学习的场景理解网络由于应用场景的不同,各网络结构设计思路可大
致分为高精度和高效率两个方向.高精度网络主要应用于自动驾驶、医疗等领域,需要高性
能计算平台来完成海量数据的计算,如 FCN
[12]
、SegNet
[13]
、APCNet
[14]
、BiSeNet
[15]
等网络.
而高效率网络主要应用于移动端或机器人等嵌入式平台,通过损失部分精度来获取更高效
率,如 ENet
[16]
、ShuffleSeg
[17]
、ShelfNet
[18]
等网络.为了能同时保证网络精度与效率,本文借
鉴高精度网络结构的设计思想搭建了场景理解主干网络,保障其分割精度;同时,利用自
适应控制模块来调节网络的计算,提高网络效率,使最终的网络能准确高效的实现场景理
解.
场景理解主干网络主要由特征提取结构和上采样结构两部分构成,详细结构如表 1 所
示.特征提取结构由 init 模块和多个 stage 模块串联堆叠构成,如图 2(a)(b)所示.init 模块利
用并列的 3×3 卷积操作和 2×2 的最大池化操作来初步提取原图显著特征并过滤部分噪声,
同时设置步长为 2 来降低图像维度,方便后续 stage 模块对特征深入提取.stage 模块是特征
提取结构的核心部分,主要利用卷积、激活操作以残差结构的方式构建,而不同 stage 之
间采用步长为 2 的卷积操作进行连接,如图 2(b)中虚线部分.由于所搭建的网络层数较深,
stage 模块采用残差结构可以较好的缓解网络训练时梯度消失或梯度爆炸等问题.同时,激
活函数采用 LeakyReLU 函数,可以有效避免神经元“坏死”情况,使网络更快收敛.上采样
结构主要以金字塔式的上采样操作恢复图像尺寸,并利用提取的特征信息对图像中各个目
标像素分类,如图 2(c)所示.为充分利用图像的全局和局部信息,上采样结构通过提取
stage5~stage2 的最后一层构建金字塔结构,并利用逐层上采样融合操作来充分获取目标深
层类别以及浅层边缘信息.为避免噪声引入,同时,也借鉴当前主流网络上采样部分,如
FCN、PSPNET、ShuffleSeg 等
[12, 17]
网络,所提上采样结构主要利用中高层特征信息来保障
网络对场景信息的高精度语义分割.
表 1 场景理解主干网络结构
Table 1. Scene understanding backbone network structure
Stage
Layer Structure
Repetitions
Output Size
original
RGB, 3
1
448×448
init
Conv 3×3, 13
Max pooling 2×2, 3
1
224×224
stage1
Conv 1×1, 16
Conv 3×3, 32
Residual
1
112×112
stage2
Conv 1×1, 32
Conv 3×3, 64
Residual
2
56×56
stage3
Conv 1×1, 64
Conv 3×3, 128
Residual
8
28×28
stage4
Conv 1×1, 128
Conv 3×3, 256
Residual
8
14×14
stage5
Conv 1×1, 256
Conv 3×3, 512
Residual
4
7×7
upsample1
Conv 1×1, 256
upsample 2×2
Eltwise
1
14×14
upsample2
Conv1×1, 128
upsample 2×2
Eltwise
1
28×28
upsample3
Conv1×1, 64
upsample 2×2
Eltwise
1
56×56
upsample4
upsample 8×8
1
448×448
下载: 导出 CSV
| 显示表格
剩余13页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3651
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于matlab实现电磁优化计算功能,进行线型规划优化电磁设计.rar
- 基于matlab实现带精英策略的非支配排序遗传算法matlab 源码.rar
- 基于matlab实现差分进化算法,最新的用于替代遗传算法,是以后的主要发展方法.rar
- VSCode配置c/c++环境教程.md
- 基于matlab实现标准合作型协同进化遗传算法matlab源程序
- 七下人教.zip
- 基于matlab实现本份代码能对图像进行gabor滤波处理,结合指纹方向图以及指纹沟壑频率特性,对指纹图像进行增强.rar
- 基于matlab实现RBM神经网络实现了手写数字体识别的GUI程序.rar
- 基于matlab实现蝙蝠算法优化相关向量机建模对数据进行建模和预测.rar
- 基于matlab实现编写的禁忌搜索算法,解决了TSP问题,对初学者有重要的参考价值.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功