没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
针对深层卷积神经网络模型的训练复杂、调参技巧和经验要求高、理论分析难等问题, 提出一种训练效率高、可解释性强以及理论分析简单的图像分类算法。基于主成分分析网络(Principal Component Analysis Network, PCANet)进行特征提取, 并采用宽度神经网络(Flat Neural Network, FNN)分类图像, 最后通过直接计算得到模型参数。根据训练数据集自适应决定宽度神经网络节点数目, 增加节点时不需要重新训练, 只需要调整局部参数。实验表明, 该模型能够快速训练, 较其他非监督分类算法以及传统深层神经网络, 该模型在识别准确率方面具有较强的竞争力。
资源推荐
资源详情
资源评论
第
卷
第
期
激 光 与 光 电 子 学 进 展
,
年
月
,
基于主成分分析网络的改进图像分类算法
赵 小 虎
,
,
尹 良 飞
,
,
朱 亚 楠
,
刘 鹏
,
,
王 学 奎
,
,
沈 雪 茹
,
矿山互联网应用技术国家地方联合工程实验室
,
江苏 徐州
;
中国矿业大学物联网
(
感知矿山
)
研究中心
,
江苏 徐州
;
中国矿业大学信息与控制工程学院
,
江苏 徐州
;
微软
(
中国
)
有限公司
,
北京
摘要
针对深层卷积神经网络模型的训 练 复 杂
、
调 参 技巧 和 经 验 要求 高
、
理 论 分析 难 等 问 题
,
提 出 一种 训 练 效 率
高
、
可解 释 性 强 以 及 理 论 分 析 简 单 的 图 像 分 类 算 法
.
基 于 主 成 分 分 析 网 络
(
,
)
进行特征提取
,
并采用宽度神经网络
(
,
)
分类 图像
,
最后 通过 直接计 算
得到模型参数
.
根据训练数据集自适应决定宽度神经 网络 节点 数 目
,
增 加节 点时 不 需要 重新 训 练
,
只 需要 调整 局
部参数
.
实验表明
,
该模型能够快速训练
,
较其他非监督分类算法以及传统深层神 经网 络
,
该模 型在 识别准 确率 方
面具有较强的竞争力
.
关键词
图像处理
;
主成分分析网络
;
宽度神经网络
;
快速训练
;
可解释性
中图分类号
文献标识码
doi
:
/
Im
p
rovedIma
g
eClassificationAl
g
orithm BasedonPrinci
p
al
Com
p
onentAnal
y
sisNetwork
Abstract
Ke
y
words
OCIScodes
收稿日期
:
;
修回日期
:
;
录用日期
:
基金项目
:
国家重点研发计划
(
)
EGmail
:
激 光 与 光 电 子 学 进 展
引
言
近十 年来
,
深度学习在 计算机视觉 领域取得了
巨大成功
.
它能够 从原始的 像 素出发
,
通过多层 结
构自动学习有效特 征
,
用于图像 识 别或实现 其 他视
觉任务
.
在图像识 别算法中
,
最常用的 深 度学习结
构是卷积神 经 网 络
(
,
).
最为著名的是
等
[
]
提出的卷积 神经
网络模型之一
,
即
,
模 型 简 单
,
仅 仅 包 含 卷 积
层以及池化层
.
年
等
[
]
提出了一种 深
度学习结构
,
将图像识别带入一个全新的阶段
.
年
,
等
[
]
提 出 了
,
通
过加深
模型的深度
,
构造出
层网络结构
,
并
采用
和
技 术
,
获 得 了 当 年
(
,
)
的冠 军
.
相 比 于
,
等
[
]
极
大地增加了
的深度
,
构建了一个
层的深度
卷积 网 络
———
,
在
上 的 识 别
率将
错 误 率 降 到 了
,
获 得 了
的冠军
.
年
,
微软构造了一个具有
层
的 深 度 残 差 图 像 识 别 网 络
(
,
)
[
]
,
在
上 错 误 率 降 到 了
,
获得了当年
的冠军
.
随着 卷积神经网 络层数的不 断增加
,
模型能力
逐渐增强
,
识别效果也逐渐变好
.
但模型越深
,
训练
越不易收敛
,
并且对计算性能要求也极高
,
训练效率
低下
;
反之
,
当层数比较少的时候识别率降低
.
且模
型层数越多则模型 复杂度越 高
,
训练时对 数 据集要
求也较高
.
另外
,
对于复杂的模型而言
,
除了训练效
率极低外
,
模型理论分析较为困难
,
训练时往往依靠
丰富的调参技巧和经验
.
等
[
]
指 出
,
即 使 是 简 单 的 双 层 网 络
,
也
可以通过增加模型 的宽度代 替 模型的深 度
,
进而获
得满意的效果
.
等
[
]
提 出 宽 度 神 经 网 络 模 型
(
,
),
通 过 自 适 应 增 加 模
型宽度来调整模型 网络结构
,
以达到优 秀 的预测效
果
.
其网络结构包括输入层
、
输 出 层 和 隐 含 层 共
层
,
其中隐 含 层 由 特 征 映 射 节 点 和 增 强 节 点 组 成
.
的网络结构特点使得输入输出具有线性形式
,
其权值通过计算一步
(
)
更新
,
训练迅速
,
广
泛应用于分类任务
[
]
和时间序列预测
[
]
.
,
等
[
]
提 出 新 的 深 度 特 征 提 取 框
架
———
主 成 分 分 析 网 络
(
,
).
该 方 法 由 主 成 分 分
析
(
,
)、
哈希运算
和分块直方 图
个 基 本 操 作 组 成
.
是 一 种 特
征抽取的方法
,
将原特征进行线性变换
,
映射至低纬
度空间中
,
具有简化复杂问题的优点
,
广泛地应用于
各类光 学 图 像 的 处 理 任 务
[
]
.
通 过 将
进行两级级联构造多级滤波器
,
然后由二进 制
哈希算法进行索引
,
最后用分块直方图进行合并
,
输
出提取特征
.
通过
选择卷积核的参数
,
直接计
算得到模型参数
,
模型训练 简 单且非常 易 于进行理
论分 析
.
该 方 法 在 许 多 图 像 分 类 任 务 中 表 现 优
异
[
]
,
已成为图像识别领域的一个研究热点
.
本文 针对上述 深 层 卷 积 神 经 网 络 模 型 的 训 练
复杂
、
调 参 技 巧 和 经 验 要 求 高
、
理 论 分 析 难 等 缺
点
,
结合
和
,
提出一 种 可 以 快 速 调 参
并且易 于 进 行 理 论 分 析 的 神 经 网 络 图 像 分 类 模
型
.
该模型利 用
进 行 分 类 图 像 的 特 征 提
取
,
并将
的 输 出 作 为 宽 度 神 经 网 络 的 输
入
,
进而通 过 宽 度 神 经 网 络 分 类
.
所 提 模 型 具 备
以下优点
:
)
改 善 了 传 统 深 层 卷 积 神 经 网 络 模 型
复杂的参数 更新机制
,
使 其 调 参 简 单
,
模 型 训 练 速
度极快
;
)
可以自适应 动 态 调 节 宽 度 神 经 网 络 的
节点 个数
,
以调节网络 结构
;
)
通过直接计 算 得 到
参数
,
理论分析简 单
.
基 于 主 成 分 分 析 网 络 的 改 进 图 像
分类模型
2.1PCANet
旨在 设 计 一 个 可 通 过 计 算 得 到 模 型
参数 的 深 度 神 经 网 络
,
由
部 分 组 成
:
输 入 层
、
滤波器 层 和 输 出 层
.
其 中
,
滤 波 器 层 由
两级级联 的 卷 积 神 经 网 络 组 成
,
卷 积 核 的 参 数 通
过
直接得到
;
输 出 层 由 二 进 制 哈 希 算 法 和 分
块直方图组 成
.
利 用 输 出 层 得 到 的 特 征 向 量 来 训
练宽度神经 网络模型
,
最 后 用 于 图 像 分 类
,
具 体 模
型架构如图
所示
.
对于输入图 片
(
大 小 为
m
n
),
首 先 在 每 个 像
素周围进行一次
k
k
的块采样
,
用所有的采样块
级 联 表 示 该 图 片
,
第
i
张 图 片 可 以 表 示 为
x
i
,
,
x
i
,
,,
x
i
,
mn
R
k
k
,
其中
x
i
,
j
表示第
i
张 图 片
的第
j
个块
(
)
的向量化
,
k
k
表示
k
k
的
值
;
然 后 对 采 样 的 块 进 行 去 均 值 化 处 理
:
X
i
x
i
,
,
x
i
,
,,
x
i
,
mn
[ ]
,
其中
mn
表 示
m
n
的 值
;
最
后对训练集中的其 他 图片作同 样 处理
,
得到处理 后
的训练样本矩阵表示为
剩余10页未读,继续阅读
资源评论
weixin_38518722
- 粉丝: 7
- 资源: 845
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功