没有合适的资源?快使用搜索试试~ 我知道了~
一种优化的可拓展激光雷达点云可学习二值量化网络.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 135 浏览量
2023-02-23
20:39:59
上传
评论
收藏 4.11MB DOCX 举报
温馨提示
试读
30页
一种优化的可拓展激光雷达点云可学习二值量化网络.docx
资源推荐
资源详情
资源评论
摘要
为解决激光雷达点云深度学习网络模型在移动端嵌入式设备部署存在的耗时耗存储问题,提
出了一种激光雷达点云可学习二值量化网络模型。该模型基于特征的知识蒸馏,将全精度网
络各层统计特征知识转移到二值量化网络,较大幅度地提升了量化精度;提出基于遗传算法
的二值量化尺度因子恢复可学习优化算法,通过逐层搜索初始最优尺度恢复因子,并通过网
络自学习大幅减少网络参数量;提出一种统计自适应池化损失最小化算法,包括量化网络自
调节和全精度网络转移调节两种方式,以解决量化网络中池化信息损失较大的问题。实验结
果表明,所提算法在获取高精度的同时实现了较大压缩比和加速比,可将 PointNet 大小压缩
为原来的 1/23、加速 35 倍以上,对其他点云主流深度网络具有良好的扩展性。
Abstract
To solve the time-consuming and storage problems of the LiDAR point cloud deep
learning network models in the deployment of embedded devices on the mobile terminal,
a learnable binary quantization network model for LiDAR point clouds is proposed. The
model refers to the idea of feature-based knowledge distillation and transfers the
statistical feature knowledge of each layer of the full-precision network to the binary
quantization network, which greatly improves quantification accuracy. A genetic-algorithm
based learnable optimization algorithm for scale factor recovery of binary quantization is
proposed, which searches for the initial optimal layer-wise scale recovery factor, and
greatly reduces amount of network parameters through network self-learning. A statistical
adaptive pooling loss minimization algorithm is proposed, including quantitative network
self-adjustment and full-precision network transferring adjustment, which solves the
problem of greater pooling information loss of quantitative networks. Experimental results
show that the proposed algorithm achieves larger compression ratio and speedup ratio
while obtaining high precision. Theoretically, it can compress PointNet by 23 times and
accelerate it by 35 times at least or more, and also achieves good scalability for other
mainstream point cloud deep networks.
1 引言
近些年,随着激光雷达在自动驾驶、机器人、智慧城市、增强现实和可穿戴设备等领域的广
泛应用
[1-3]
,基于深度学习的激光雷达点云数据处理受到国内外研究机构和学者的广泛关注
[4-
5]
。包括 PointNet
[6]
、PointNet++
[7]
、PointCNN
[8]
、DGCNN
[9]
和 PointConv
[10]
在内的典型点
云深度神经网络模型的成功应用使得基于深度学习的三维点云处理方法已成为国内外研究
热点。然而,这些点云深度学习网络模型具有庞大的参数规模,与其相伴的计算开销与内存
需求使其在计算资源受限平台(如嵌入式设备)的部署中遇到了巨大的挑战,移动端设备部署
应用的迫切需求使得对资源消耗少、占用存储少、精度较高的压缩模型备受关注,因此对点
云深度学习模型压缩的研究显得尤为迫切。
量化作为模型压缩的一种重要方法,在二维图像深度学习领域已得到广泛研究
[11]
。特别地,二
值量化作为一种极限量化,将浮点型位数量化为 1 位,具有极高压缩比,是当前深度模型压缩
领域的前沿研究热点
[12-23]
,其代表性研究成果包括 BNN(Binarized Neural Networks)
[11]
、
XNOR-Net
[12]
、Bi-Real Net
[13]
和 IR-Net
[14]
等。二维图像和三维点云存在根本区别
[1]
,使得这
些方法不能直接转换到三维点云网络中去,如点云深度模型量化存在特征累加同质退化严重
的问题
[24]
。迄今唯一的针对点云深度网络二值量化压缩的研究成果为 2021 年计算机视觉
领域顶会(ICLR)录用的 BiPointNet
[24]
,其主要贡献在于利用信息熵理论解决池化聚合引起的
特征鉴别力大幅下降的问题,设计最大熵聚合(EMA)模块和分层尺度恢复模块虽然提升了全
局特征表示能力,也一定程度减小了量化尺度变形,但在求最大熵平移变换量过程中,求解目
标函数时采用线下蒙特卡罗仿真进行近似,无法准确求出复杂目标函数的闭合解析解。由于
点云深度学习模型量化研究处于起步阶段,量化网络的整体性能还有较大的提升空间。
为进一步有效提升点云二值量化网络模型的整体性能,本文主要研究工作包括:实现基于层
的统计特征知识转移,充分利用点云全精度网络来提升二值量化网络的性能;为平衡点云深
度量化模型的压缩性能和精度性能,提出一种基于遗传算法的二值量化尺度因子可学习的方
法,通过优化确定层初始最佳尺度恢复因子,并通过网络进行学习更新;为解决点云深度网络
池化聚合操作造成的特征鉴别能力大幅下降的问题,提出一种统计自适应池化损失最小化方
法。本研究成果对激光雷达点云深度学习模型在移动端嵌入式设备上的部署方面具有潜在
的应用价值。
2 点云可学习二值量化网络模型
本节首先介绍所提激光雷达点云可学习二值量化网络模型的整体架构,其次分别对基于遗传
算法的二值量化尺度因子恢复可学习优化方法、统计自适应池化损失最小化算法进行原理
分析。
2.1 模型整体架构
点云可学习二值量化网络通用模型框架如图 1 所示。该模型包括预训练的点云全精度网
络、点云二值量化网络、尺度恢复模块(SR)和统计自适应池化损失最小化模块(PLM)。全
精度网络和量化网络之间进行基于层的统计特征知识转移,具体地,卷积层和全连接层通过
SR 得到二值量化最优尺度因子初始参数,池化层通过统计自适应 PLM 得到初始调整参数,
从而量化模型,得到每层的基于统计特征知识转移的初始调整参数,进而通过量化网络自学
习过程不断地更新、最优化这些参数值。同时,每层仅设置一个调整参数,使得量化模型额
外存储占用少,其在提升模型精度的同时保证了整体性能的优越性。点云可学习二值量化网
络与对应的点云全精度网络的结构相同,不论选取何种点云网络模型进行二值量化,涉及的
量化操作及尺度恢复、统计自适应池化损失最小化等优化操作不受相关采样层采样方式的
影响,具有通用的优化性能。
图 1. 点云可学习二值量化通用网络模型框架
Fig. 1. General framework for point cloud learnable binary quantization network
model
下载图片 查看所有图片
本文以典型的点云深度网络模型 PointNet 二值量化为例进行分析,同时拓展到
PointNet++、PointCNN 和 PointConv 等其他主流模型。PointNet 可学习二值量化网络模
型如图 2 所示,包括分类网络和分割网络。量化模型中所有卷积层和全连接层通过 SR 获取
基于全精度统计特征转移的初始尺度因子,池化层通过 PLM 获取初始调整参数。由于网络
中输入转换模块和特征转换模块包括了卷积层、池化层和全连接层,所以这两个模块均需通
过 SR 和 PLM 获取初始参数。在分类网络和分割网络训练中,通过反向传播分别学习、更
新相关参数。
图 2. PointNet 可学习二值量化网络模型
Fig. 2. Learnable binary quantization network model of PointNet
下载图片 查看所有图片
问题定义:点云全精度网络模型卷积层和全连接层的输出特征用 F
i
(x
i
;α
i
)表示,其中下标 i 表示
层数,x
i
为网络第 i 层输入,α
i
为全精度模型第 i 层参数;池化层输出特征用 T(f)jTj(f)(x
j
)表示,其
中下标 j 表示池化层序数,x
j
为输入,上标 f 代表全精度;二值量化网络模型卷积层和全连接层
的输出特征用 Q
i
(x
i
;β
i
)表示,其中 β
i
为量化模型第 i 层参数;池化层输出特征用 T(b)iTi(b)(x
i
)表
示,其中下标 i 表示池化层序数,x
i
为输入,上标 b 代表二值量化。通过将 F
i
(x
i
;α
i
)和 Q
i
(x
i
;β
i
)输
入 SR 得到第 i 层初始最优尺度恢复因子 λ
i
;统计自适应 PLM 的输入既可以是 T(b)iTi(b)(x
i
),
也可以是 T(f)jTj(f)(x
j
)和 T(b)iTi(b)(x
i
),分别对应量化网络自调节、全精度网络统计特征转移
调节方式,得到量化网络池化层特征初始调整参数 φ
i
。训练中通过量化网络反向传播更新 λ
i
和 φ
i
值,进而不断优化量化网络性能。
2.2 基于遗传算法优化的二值量化尺度因子恢复方法
本节给出点云可学习二值量化模型的 SR 具体实现原理,如图 3 所示。为提升量化网络卷积
层和全连接层的特征表达能力,通过将预训练全精度网络各层统计分布特征转移,并联合量
化特征统计分布进行搜索优化,获取量化网络每层尺度恢复因子,以减少二值量化带来的严
重尺度失真。
图 3. 基于遗传算法优化的二值量化尺度因子恢复
Fig. 3. Gene-algorithm based binary quantization scale factor recovery
下载图片 查看所有图片
具体地,对输入的全精度网络和量化网络对应层的特征数据采用无参估计法进行概率密度估
计。本文选用常见的三种无参估计方法
[25]
,包括直方图法(Hist)、核密度估计(KDE)法及 K 最
近邻(KNN)法,并进行对比分析。设点云全精度网络模型和二值量化网络模型所求的概率密
度分别为 p(f)ipi(f)(F
i
;x
i
,α
i
)和 p(b)ipi(b)(Q
i
;x
i
,β
i
)。对于直方图法,全精度网络第 i 层输出特征
F
i
的取值范围为[l
1
,l
2
],其中 l
1
、l
2
为特征最小值和最大值,总样本数为 N
(f)
,将取值范围分成 k
个等间隔区间,统计每个区间内的样本个数 N(f)jNj(f),其中 j∈[1,k],则第 j 个区间的概率密度
为
p(f)ij=N(f)jN(f),(1)pij(f)=Nj(f)N(f),(1)
则有
p(f)i(Fi;xi,αi)=(p(f)i1,p(f)i2,…,p(f)ik)=(N(f)1N(f),N(f)2N(f),…,N(f)kN(f)),(2)pi(f)(Fi;xi,αi)=(pi1(f
),pi2(f),…,pik(f))=N1(f)N(f),N2(f)N(f),…,Nk(f)N(f),(2)
同理,有
p(b)i(Qi;xi,βi)=(p(b)i1,p(b)i2,…,p(b)ik)=(N(b)1N(b),N(b)2N(b),…,N(b)kN(b))
。
(3)pi(b)(Qi;xi,βi)=(pi1(b),pi2(b),…,pik(b))=N1(b)N(b),N2(b)N(b),…,Nk(b)N(b)。(3)
对于 KDE 法,首先定义 R
N
为 n 维特征空间 n 维超立方体,棱长为 h
N
,体积为 hnNhNn,选取核
函数 φ(·):当样本 m
j
∈F
i
落入以 m 为中心的超立方体 R
N
中,计数 1;否则,计数 0。核函数可
表示为
φ(m)=φ(m−mjhN),(4)φ(m)=φm-mjhN,(4)
剩余29页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3660
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功