没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
为了进一步提高大规模多种类点云模型识别与分类的准确率,提出了一种K近邻卷积神经网络模型。首先,利用最远点采样算法对点云模型均匀采样;其次,对采样后的点云模型用K近邻算法构建每个点的局部邻域,为防止信息的非局部扩散,对卷积层提取的特征也逐个建立局部邻域;然后,通过最大池化聚合所有局部特征得到点云模型的全局特征表示;最后,用全连接层与Softmax函数计算各类别对应的概率并分类。实验结果表明,本算法在公开数据集ModelNet40上的识别准确率为92%。与已有的点云模型识别与分类算法相比,能更有效地融合局部结构特征,提高点云模型识别与分类的准确率。
资源推荐
资源详情
资源评论
第
卷
第
期
激 光 与 光 电 子 学 进 展
年
月
Laser&O
p
toelectronicsPro
g
ress
Ma
y
基于
K
近邻卷积神经网络的点云模型识别与分类
于 挺
,
杨 军
兰州交通大学电子与信息工程学院
甘肃 兰州
摘要
为了进一步提高大规模多种类 点云 模 型识 别与 分 类的 准确 率
提 出了 一种
近 邻卷 积 神 经网 络 模 型
首
先
利用最远点采样算法对点云模型均匀采样
其次
对采样 后的点 云模 型用
近邻 算法 构建每 个 点的 局部 邻 域
为防止信息的非局部扩散
对卷积层提取的特征也逐个建立局部邻域
然后
通过最 大池 化聚合 所有 局部特 征得 到
点云模型的全局特征表示
最后
用全连接层与
函数计算各类别对 应的 概率并 分类
实验 结果 表明
本算
法在公开数据集
上的识别准确率为
与已有的点 云模 型识别 与分 类算法 相比
能更 有效 地融 合
局部结构特征
提高点云模型识别与分类的准确率
关键词
机器视觉
模型识别
近邻
局部特征
缩放指数线性单元函数
中图分类号
文献标志码
doi
:
.
/
LOP.
PointCloud ModelReco
g
nitionandClassificationBasedon
KGNearestNei
g
hborConvolutionalNeuralNetwork
YuTin
g
Yan
g
Jun
Schoolo
f
ElectronicandIn
f
ormationEn
g
ineerin
g
LanzhouJiaoton
g
Universit
y
Lanzhou
Gansu
China
Abstract
Ke
y
words
OCIScodes
收稿日期
修回日期
录用日期
基金项目
国家自然科学基金
EGmail
引
言
三维模型识别是计算机图形学和视觉领域的重
要研究内容之一
目前关于二维图像识别与分类的
研究成果较多
二维图像的生成可理解为图像从
三维空间到二维空 间的映射 过 程
该过程容 易 丢失
大量的结构信息
导致对物 体 二维图像 的 识别无法
满足人类需求
随着工业 自 动化程度 的 提高
可大
量生产成本 低
可 靠 性 强 的 三 维 传 感 器
如
相机
和
有效构建三 维模型
的通用数据表示
促进了计 算 机视觉领 域 的进一步
发展
也为智能机器人在真实环境中工作提供保障
激 光 与 光 电 子 学 进 展
卷积神经网络
作为深度学 习的一种
在
图像处理领域具有明 显的优势
标准的
模型
通常以规则的数据 作为输入
如将二维 图 像变成由
像素排列的阵列
体素化模 型 是将三维 多 边形网格
模型离散化为规则二值化的占用网格形式
点云模
型是通过
直 接 获 得 的 原 始 数 据
数 据 点 排
列具有不 规 则 性
因 此
如 何 利 用
处 理 点 云
模型
是计算机视觉领域的重要研究方向
受
网络的启发
本文提出了 一种
近邻卷积神经网络
模 型
能 融 合 点 云
模型的局部结构信息
增强识别细粒度模型的能力
将点云模型利用
近邻
算法逐点 构 建局部
邻域
得到每个局部邻域内 的
k
个点
通过卷积 层
的特征提取和最大 池化层的 特 征聚合
得到鲁棒 的
模型结构特 征
在 特 征 提 取 过 程 中
利 用
算
法逐特征构建局部 邻域
有效防止 了 信息的非 局 部
扩散
提 高 了 点 云 模 型 识 别 与 分 类 的 准 确 率
在
的 优 化 过 程 中
利 用
函 数 和 批 量 标 准
化
使
达到最优识别与分类效果
相关研究工作
物 体 或 场 景 的 识 别 与 分 类 都 离 不 开 特 征 的 提
取
点云模型的识别方法多是提取对象的形状
结构
特征或者多种特征 的组合形 式 形成特征 描 述符
再
通过对比特征描述 符的相似 性
完成模型 的 识别与
分类
可分为基于手工提取特征和基于深度学习的
模型识别与分类方法
传统的基于手工提取特征模型的识别与分类方
法
如利用二维数 据 表征三维 特 征的旋转 图 像
方法
三维形状 上 下文
方法
基于几何
特征的点 特 征 直 方 图
描 述 符
以 及 通 过 测
量密集采样 表 面 点 获 取 的 局 部 形 状 直 径 函 数 描 述
符
球 谐 函 数 描 述 符
全 局 点 签 名
热 核 签 名
以 及 波 核 签 名
等描述符
手工提取 的 特征描述 符 虽然
在三维模型识别与 分类中表 现 良好
但设计描 述 符
需要先验知识
且只能解 决 特定问题
普适性较 差
因此研究人员结合深度学习提取特征研究了三维模
型的识别与分类
基于深度学习的模型识别与分类方法按照输入
数据的不同可分为 基于投影 图 像的方法
基于体素
的方法和基于点云的 方法
等
提出了一 种 基
于多视角
的方法
首先获得三 维形状在
个
不同视点下的投影图
然后采用
学 习 各 视
点下投影图的特征
最后将所 有 特征进行 池 化操作
并送入一个
模型中得到最终的形状特征
等
沿主轴方 向 进 行 圆 柱 投 影 将 三 维 形 状 转 化 为
多个全景图
再 利 用
从 全 景 图 中 学 习 特 征 表
示
基于投影图像的方法优势在于利用了图像分类
网络
识别准确率高
但并没有利 用
直接处理
三维模型
基于体素的方法是将三维多边形网格模
型通过占用网格规范化计算转化为二值三维体素矩
阵
为
的 处 理 提 供 了 便 利
等
将 三 维
形状表示为二值概 率分布
并采用卷 积 深度置信 网
络学习三维体素与 标签之间 的 联合分布
实现了三
维体素模型的识别与分类
等
用定向搜索 优
化
网络减少了
的参数数量
以
提高分类的准确率
文献
对训练集中的体素模
型进行旋转
获取到该模型的旋转副本
增加了训练
集的数据量
通过扩 展 训练集降 低 了网络的 过 拟合
率
同时在训练过程 中 增强了网 络 对不同角 度 三维
模型的识别能力
文献
在特征提 取 过程中
使
用堆叠的深度小卷积核
有效提取了模型内部
的隐含信息
增强了特征的表达能力和差异性
提高
了大规模复杂三维模型识别的准确率
基于体素数
据的方法使用三维 体 素保留三 维 模型的形 状 信息
有利于提高特征的鉴别力
但由于输入数据和卷积
核维数较高
使计算量 和 内存都急 剧 膨胀
虽然使
用八叉树
的方法优化算法可以提 高计算速度
但
处理高分辨率体素模型仍较为困难
文献
提 出 结 合 深 度 学 习 处 理 点 云 模 型 的
网络 架 构
首 先 从 每 个 点 的 多 层 感 知 机
中计算各点的特征
然后应用 对 称函数将 所 有特征
聚合为点云的一个 全局表示
最后通过 全 连接层得
到分类结果
文献
提出了 一种类似 于 文献
的排列等变层
区别 在 于排列等 变 层对于非 线 性输
入是最大归一化的
二者都解决了点云的无序性问
题
但 并 未 充 分 利 用 局 部 结 构 信 息
等
提 出
了
的改进方案
采用分层应
用
的思想
提取局部区域的几何特征
首
先将点 云 分 割 为 较 小 的 点 集
并 利 用
提
取这些小 点 集 的 特 征
然 后 对 更 高 维 的 特 征 迭 代
重复此过程
从而获得 局 部 结 构 特 征
但 会 导 致 体
系结构变复 杂
降 低 网 络 的 训 练 速 度
文 献
在
前端的 核 相 关 层 计 算 每 个 数 据 点 的
k
个
最近 邻点与
M
个 核 心 点 之 间 的 亲 和 力
获 取 初 始
点特征
然 后 利 用 最 大 池 化 处 理 获 取 鲁 棒 的 局 部
结构特 征
最 后 利 用 全 局 最 大 池 化 聚 合 特 征
文
剩余8页未读,继续阅读
资源评论
weixin_38538381
- 粉丝: 6
- 资源: 907
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 项目采用YOLO V4算法模型进行目标检测,使用Deep SORT目标跟踪算法 .zip
- 针对实时视频流和静态图像实现的对象检测和跟踪算法 .zip
- 部署 yolox 算法使用 deepstream.zip
- 基于webmagic、springboot和mybatis的MagicToe Java爬虫设计源码
- 通过实时流协议 (RTSP) 使用 Yolo、OpenCV 和 Python 进行深度学习的对象检测.zip
- 基于Python和HTML的tb商品列表查询分析设计源码
- 基于国民技术RT-THREAD的MULTInstrument多功能电子测量仪器设计源码
- 基于Java技术的网络报修平台后端设计源码
- 基于Python的美食杰中华菜系数据挖掘与分析设计源码
- 基于Java与JavaScript混合技术的吉森摄影项目设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功