
引
言
图像识别是一种利用计算机对图像进行处理
、
分析和理解
,
以识别各种不同模式的目标和对象的技
术
,
是计算机视觉领域的一个主要研究方向
,
在以图像为主体的智能化数据采集与处理中具有十分重要
的作用和影响
。
使用图像识别技术能够有效地处理特定目标物体的检测和识别
(
如人脸
、
手写字符或是
商品
)、
图像的分类标注以及主观图像质量评估等问题
。
目前图像识别技术在图像搜索
、
商品推荐
、
用户
行为分析以及人脸识别等互联网应用产品中具有巨大的商业市场和良好的应用前景
,
同时在智能机器
人
、
无人自动驾驶和无人机等高新科技产业以及生物学
、
医学和地质学等众多学科领域具有广阔的应用
前景
。
早期的图像识别系统主要采用尺度不变特征变换
(
Scale
-
invariant
feature
transform
,
SIFT
[
1
]
)
和
方向梯度直方图
(
Histo
g
ram
of
oriented
g
radients
,
HOG
[
2
]
)
等特征提取方法
,
然后将提取到的特征输入
至分类器中进行分类识别
。
这些特征本质上是一种手工设计的特征
,
针对不同的识别问题
,
提取到的特
征好坏对系统性能有着直接的影响
,
因此需要研究人员对所要解决的问题领域进行深入的研究
,
以设计
出适应性更好的特征
,
从而提高系统的性能
。
这个时期的图像识别系统一般都是针对某个特定的识别
任务
,
且数据的规模不大
,
泛化能力较差
,
难以在实际应用问题当中实现精准的识别效果
。
深度学习是机器学习的一个分支
,
是近些年来机器学习领域取得的重大突破和研究热点之一
。
2006
年
,
加拿大多伦多大学教授
、
机器学习领域的泰斗
Geoffer
y
Hinton
和他的学生
Ruslan
Salakhutdi
-
nov
在国际顶尖学术刊物
《
Science
》
上发表了一篇文章
[
3
]
,
第一次提出了深度学习的思想
。
这篇 文章主
要提出了两个观点
:(
1
)
含多个隐层的人工神经网络具有十分强大的特征学习能力
,
通过训练模型所提
取的特征对原始输入数据具有更抽象和更本质的表述
,
从而有利于解决特征可视化或分类问题
;(
2
)
通
过使用无监督学习算法实现一种称作
“
逐层初始化
”
的方法
,
实现对输入数据信息进行分级表达
,
从而可
以有效地降低深度神经网络的训练难度
。
随后
,
深度学习在学术界和工业界持续升温
,
在语音识别
、
图
像识别和自然语言处理等领域获得了突破性的进展
。
2011
年以来
,
研究人员首先在语音识别问题上应
用深度学习技术
,
将准确率提高了
20%
~
30%
,
取得了十多年来最大的突破性进展
。
仅仅一年之后
,
基于卷积神经网络的深度学习模型就在大规模图像分类任务上取得了非常大的性能提高
,
掀起了深度
学习研究的热潮
。
文献
[
4
]
提出了两种基于深度神经网络的声学建模方法
,
相比于传统建模方法提取到
了更有效的声学特征
,
并在维吾尔语的大词汇量连续语音识别应用上取得了较大的性能提升
。
目前
,
谷
歌
、
微软和
Facebook
等众多国际互联网科技企业争相投入大量的资源
,
研发布局大规模的深度学习系统
。
1
卷积神经网络
20
世纪
60
年代初期
,
Hubel
和
Wiesel
等通过对猫的大脑视觉皮层系统的研究
,
提出了感受野
[
5
]
的
概念
,
并进一步发现了视觉皮层通路中对于信息的分层处理机制
,
由此获得了诺贝尔生理学或医学奖
。
到了
80
年代中期
,
Fukushima
等基于感受野概念提出的神经认知机
[
6
]
,
可以看作是卷积神经网络
(
Con
-
volution
neural
networks
,
CNNs
)
的第一次实现
,
也是第一个基于神经元之间的局部连接性和层次结构
组织的人工神经网络
。
神经认知机是将一个视觉模式分解成许多子模式
,
通过逐层阶梯式相连的特征
平面对这些子模式特征进行处理
,
使得即使在目标对象产生微小畸变的情况下
,
模型也具有很好的识别
能力
。
在此之后
,
研究人员开始尝试使用一种被称作多层感知器
[
7
]
的人工神经网络
(
实际上是只含一层
隐含层节点的浅层模型
)
来代替手工提取特征
,
并使用简单的随机梯度下降方法来训练该模型
,
于是进
一步提出了用于计算误差梯度的反向传播算法
,
这一算法随后被证明十分有效
[
8
]
。
1990
年
,
LeCun
等
[
9
]
在研究手写数字识别问题时
,
首先提出了使用梯度反向传播算法训练的卷积神经网络模型
,
并 在
MNIST
[
10
]
手写数字数据集上表现出了相对于当时其他方法更好的性能
。
梯度反向传播算法和卷积神
经网络的成功给机器学习领域带来了新的希望
,
开启了基于统计学习模型的机器学习浪潮
,
同时也带动
2
数据采集与处理
Journal
o
f
Data
Ac
q
uisition
and
Processin
g
Vol.31
,
No.1
,
2016
评论0
最新资源