没有合适的资源?快使用搜索试试~ 我知道了~
复杂背景下基于图像处理的桥梁裂缝检测算法_李良福1
需积分: 0 7 下载量 65 浏览量
2022-08-03
12:58:02
上传
评论
收藏 3.88MB PDF 举报
温馨提示
试读
11页
摘要针对传统桥梁裂缝检测算法不能准确提取裂缝的问题,提出了一种复杂背景下基于图像处理的桥梁裂缝检测算法。根据深度卷积生成式对抗网络原理,利用桥梁裂缝图像生成模型
资源详情
资源评论
资源推荐
书书书
第
56
卷
第
6
期
激光与光电子学进展
Vol.56
,
No.6
2019
年
3
月
Laser
& O
p
toelectronics
Pro
g
ress
March
,
2019
复杂背景下基于图像处理的桥梁裂缝
检测算法
李良福
**
,
孙瑞赟
*
陕西师范大学计算机科学学院
,
陕西 西安
710119
摘要
针对传统桥梁裂缝检测算法不能准确提取裂缝的问题
,
提出了一种复杂背景下基于图像处理的桥梁裂缝检
测算法
。
根据深度卷积生成式对抗网络原理
,
利用桥梁裂缝图像生成模型
,
对数据集进行扩增
。
针对裂缝特征构
建基于语义分割的桥梁裂缝图像分割模型
,
利用桥梁裂缝图像分割模型提取高分辨率裂缝图像中的裂缝
。
研究结
果表明
,
与现有算法相比
,
所提算法在复杂道路场景中具有更好的检测效果和更强的泛化能力
。
关键词
图像处理
;
复杂背景
;
桥梁裂缝检测
;
深度卷积生成式对抗网络
;
语义分割
中图分类号
TP391.9
文献标识码
A doi
:
10.3788
/
LOP56.061002
Brid
g
e
Crack
Detection
Al
g
orithm
Based
on
Ima
g
e
Processin
g
under
Com
p
lex
Back
g
round
Li
Lian
g
fu
**
,
Sun
Rui
y
un
*
School
o
f
Com
p
uter
Science
,
Shaanxi
Normal
Universit
y
,
Xi
′
an
,
Shaanxi
710119
,
China
Abstract
In
order
to
solve
the
p
roblem
that
the
traditional
brid
g
e
crack
detection
al
g
orithm
cannot
extract
cracks
accuratel
y
,
a
brid
g
e
crack
detection
al
g
orithm
is
p
ro
p
osed
based
on
ima
g
e
p
rocessin
g
,
which
is
suitable
for
com
p
lex
scenes.Accordin
g
to
the
p
rinci
p
le
of
the
dee
p
convolutional
g
enerative
adversarial
network
,
the
brid
g
e
crack
ima
g
e
g
enerative
model
is
p
ro
p
osed
and
used
to
am
p
lif
y
the
dataset.For
the
characteristics
of
brid
g
e
cracks
,
a
brid
g
e
crack
ima
g
e
se
g
mentation
model
is
constructed
based
on
semantic
se
g
mentation.The
brid
g
e
crack
ima
g
e
se
g
mentation
model
is
used
to
extract
the
brid
g
e
cracks
from
the
hi
g
h
-
resolution
crack
ima
g
es.The
research
results
show
that
the
p
ro
p
osed
al
g
orithm
has
a
better
detection
effect
and
a
stron
g
er
g
eneralization
abilit
y
in
the
com
p
lex
road
scenes
com
p
ared
with
the
existin
g
al
g
orithms.
Ke
y
words
ima
g
e
p
rocessin
g
;
com
p
lex
back
g
round
;
brid
g
e
crack
detection
;
dee
p
convolutional
g
enerative
adversarial
network
;
semantic
se
g
mentation
OCIS
codes
100.2000
;
100.4996
;
100.1830
;
150.1135
收稿日期
:
2018
-
09
-
12
;
修回日期
:
2018
-
09
-
25
;
录用日期
:
2018
-
09
-
30
基金项目
:
国家自然科学基金
(
61573232
,
61401263
)
*
E
-
mail
:
984789463
@
qq
.com
;
**
E
-
mail
:
lon
g
ford
@
x
j
tu.edu.cn
1
引
言
交通运输是经济发展的基本需要和先决条件
,
是现代社会的生存基础和文明标志
,
是工业发展的
基础设施和重要纽带
,
关系着国家经济的发展
,
承载
着社会进步的命脉
[
1
-
2
]
。
据
《
2017
年国民经济 和社
会发展统计公报
》
[
3
]
统计
,
在
2017
年
,
我国新改建高
速公路里程为
6796km
,
新建高速铁路投产里程为
2182km
,
建成了世 界上最 大的高 速公路 网和高 铁
运营网
。
我国重建 设 而忽 养 护的 公 路 桥梁 管 理模
式
,
加快了桥梁与道路老化的速度
,
容易造成安全隐
患
[
4
]
。
已有研究表明
,
混凝土桥梁长期受直接应力
与次生应力的作用将会产生桥梁裂缝
,
而桥梁裂缝
是桥梁损伤状况的外在表现
,
是桥梁结构达到承载
力极限的标志
。
因此
,
对混凝土桥梁裂缝的检测十
分重要
。
采取有效手段对桥梁裂缝进行检测
[
5
]
对确保公
共交通的安全和正常运行具有十分重要的作用
,
长
061002
-
1
激光与光电子学进展
期以来受到了国内外学术界
、
工程界的广泛关注
,
并
且取得了一些优秀的研究成果
。
Oh
等
[
6
]
提出了迭
代的阈值分割算法
,
但该算法的阈值需要人工设置
;
孙亮等
[
7
]
提出了基 于自适 应阈 值
Cann
y
算法 的 裂
缝检测方法
,
该算法解决了需要人工设置阈值的缺
陷
,
但没有考虑光照不均与噪声对裂缝识别造成的
影响
,
很难保证稳定性
;
Talab
等
[
8
]
利用
Otsu
与多
重滤波结合的算法提取裂缝
,
该算法考虑了由光照
不均造成的影响
,
但是单一的阈值使得该算法并不
能适用于所有的图像
。
近年来
,
机器学习与深度学习成为人工智能领
域飞速发展的热点
,
许多科研工作者成功地将桥梁
裂缝检测与之结合
。
Zhan
g
等
[
9
]
利用深度卷积神经
网络实现对桥梁裂缝的提取与检测
,
但是该算法检
测到的裂缝宽度与真实裂缝宽度相差极大
;
Chen
等
[
10
]
使用卷积神经网络和朴素贝叶斯数据融合的
NB
-
CNN
网络进行裂缝检测
,
该算法的优点是可以
检测到微小的裂缝
,
但仅能检测到裂缝的位置
,
并不
能实现对裂缝的提取
;
Shi
等
[
11
]
利用随机结构森林
算法对裂缝进行自动提取
,
但是当该算法应用于复
杂背景时
,
检测效果欠佳
。
以上算法取得的良好实
验效果均建立在裂缝图像的背景简单且不存在任何
障碍物的情形之下
,
低估了桥梁路面的复杂程度
。
基于此
,
本文提出了一种基于图像处理且适用于复
杂背景的桥梁裂缝检测算法
。
具体做法为
:
首先
,
通
过桥梁裂缝图像生成模型扩增数据集
,
接着
,
利用扩
增的数据集训练桥梁裂缝图像分割模型
,
最后
,
利用
桥梁裂缝图像分割模型检测高分辨率裂缝图像中的
裂缝
。
2
数据集的扩增
这里提出的复杂背景下桥梁裂缝检测算法属于
深度学习领域
,
众所周知
,
深度学习中的网络模型所
涉及的权重参数众多
,
在训练样本不足的情况下很
容易出现欠拟合
。
因此
,
必须建立有充足样本的数
据集
。
但是到目前为止
,
全球没有公开的
、
适用于复
杂背景研究的桥梁裂缝数据集
。
而如果直接用人工
方式大量采集
,
不仅工作量极大
,
而且效率极低
。
目
前
,
由
Radford
等
[
12
]
提出的深度卷积生成式对抗网
络
(
DCGAN
)
是人工智能领域的一个研究热点
,
已
经被 成 功 用 于 生 成 全 新 图 像
。
但 文 献
[
12
]
中 的
DCGAN
模型适用于生成
64
p
ixel×64
p
ixel
大小
、
类似
cifar
-
10
、
SVHN
数据集的图像
,
无法有效生成
256
p
ixel×256
p
ixel
、
具有线性拓扑结构的桥梁裂
缝的图像
。
因此
,
提出了一种基于深度卷积生成式
对抗网络的桥梁裂缝图像生成模型
,
简称
BCIGM
。
2.1
采集数据扩增
使用
BCIGM
需要几千张图像作为训练样本
,
如果全部人工采集仍然是不易实现的
。
因此
,
数据
集的扩增分两步完成
:
第一步
,
对少量的数据通过图
像的几何变换
、
空间滤波
、
线性变换这
3
类图像处理
方法进行扩充
;
第二步
,
使用
BCIGM
生成大量裂缝
图像
。
经过第一步数据集扩充之后
,
人工手动挑选
出
9362
幅图像作为
BCIGM
的训练集
,
经过图像处
理算法扩充之后
,
部分桥梁裂缝图像数据集扩增示
意图如图
1
所示
。
图
1
桥梁裂缝图像数据集扩增示意图
。(
a
)
原图
;(
b
)
水平翻转
;(
c
)
垂直翻转
;(
d
)
线性变换
;(
e
)
空间滤波变换
Fi
g
.1 Schematic
of
dataset
am
p
lification
of
brid
g
e
crack
ima
g
es.
(
a
)
Ori
g
inal
ima
g
e
;(
b
)
horizontal
fli
p
;(
c
)
vertical
fli
p
;
(
d
)
linear
transformation
;(
e
)
s
p
atial
filterin
g
transformation
061002
-
2
激光与光电子学进展
2.2
桥梁裂缝图像生成模型
2.2.1
模型原理
桥梁裂缝图像生成模型的原理与生成式对抗网
络的原理一样
,
由具有对抗关系的生成模型
(
G
)
与
判别模型
(
D
)
组成
。
其中
,
生成模型
(
G
)
的作用是通
过学习已有真实数据样本的概率分布
,
生成尽可能
服从真实样本分布的样本
G
(
z
),
判别模型
(
D
)
的作
用是判断输入来自真实样本还是来自生成样本
G
(
z
),
实质为一个二分类模型
。
训练
BCIGM
的过
程就是不断交替更新
G
和
D
的过程
,
当生成网络
G
固定时
,
优化判别网络
,
使输入真实数据样本时的输
出尽可能趋向
1
,
输入生成数据样本时的输出尽可
能趋向
0
;
当 判 别 网 络
(
D
)
固 定 时
,
优 化 生 成 网 络
(
G
),
使生成样本经过判别网络
(
D
)
后输出高概率
,
当双方达到纳什均衡时
,
生成模型
(
G
)
生成了判别
模型
(
D
)
无法判断是否是真实样本的生成样本
。
上
述过程可表示为
min
G
max
D
V
(
D
,
G
)
=
E
x
~
p
data
(
x
)
lo
g
a
D
(
x
[ ]
)
+
E
z
~
p
z
(
z
)
lo
g
a
1
-
D
G
(
z
[ ]{ }{ }
) , (
1
)
式中
:
z
为输入生成网络的噪声
;
G
(
z
)
为生成样本
;
x
为真实数据样本
;
a
为大于
0
且不等于
1
的任意底
数
;
D
(
x
)
为
x
通过判别网络后判断为真实样本的概
率
;
D
[
G
(
z
)]
为生成样本通过判别网络后判断为真
实样本的概率
;
P
data
(
x
)
和
P
z
(
z
)
分别为真实样本数据
的概率分布和初始噪音数据的概率分布
;
E
(·)
表示
计算期望值
。
2.2.2
生成模型
生成模型的作用是将输入的噪声通过上采样生
成
256
p
ixel×256
p
ixel×3
的裂缝图像
,
主要由转
置卷积构成
。
具体 过 程为
:
首先
,
输 入
100
维 的 噪
声
;
接 着
,
通过全连接层后进行维度转换
,
转 换 为
1024
个
8×8
的特 征 图
;
最 后
,
通 过
5
个 卷 积 核 为
5×5
,
步幅为
2
,
卷积核数目依次为
512
,
256
,
128
,
64
,
3
的转置卷积
,
且除最后一个转置卷积外
,
其余
转置卷积 后均使 用
SeLU
激活函 数
[
13
]
。
生成 模 型
如图
2
所示
。
一般来说
,
转置卷积是由深而窄的层次延展为
窄而深的层次
。
在生成模型中
,
输入是由随机噪声
转换成的深而窄的特征图
,
需要通过转置卷积实现
上采样
,
从而生成
256
p
ixel×256
p
ixel
的彩色裂缝
图像
。
之所以选择转置卷积
,
是因为相较于紧邻上
采样
、
双样条采样
、
三次样条采样等手工选择采样方
法
,
更需要一种能够自动优化的上采样方法
,
而且转
置卷积已经在
DCGAN
中得到了良好的应用效果
。
图
2
生成模型
Fi
g
.2 Generative
model
之所以选择
5×5
的卷积核
,
是因为在深度学习中
,
常用的卷积核为
3×3
、
5×5
、
7×7
,
且卷积核越小
,
参数量越低
,
复杂度越小
,
但是
,
如果在桥梁裂缝检
测中选择
3×3
大小的卷积核
,
不仅不利于提取裂缝
的结构信息
,
还会受到噪声的影响
。
步幅设置为
2
是因为转置卷积的步幅定义了输出层的大小
,
且在
“
相同
”
的填充下
,
步幅为
2
时
,
输出特征的大小将是
输入层的两倍
。
卷积核的数量与特征图大小的设置
综合考虑了模型的复杂度与生成裂缝图像的真实程
度
。
卷积层数目代表了模型的复杂度
,
层数越多精
确度往往更高
,
但同样消耗的计算资源也更高
。
实
验证实
,
上述设置可在模型复杂度最低的条件下
,
生
成更真实的桥梁裂缝图像
。
BCIGM
选择
SeLU
激活函数代替
Relu
激活函
数和
Batch
Normalization
的原因有
:
第一
,
SeLU
引
入了自归一化的属性
,
使神经元激励值可以自动地
收敛到零均值和单位方差
,
并且即使是存在噪声和
扰动
,
通过许多层的前向传播后仍可收敛到零均值
和单位方差
。
此外
,
对于不逼近单位方差的激励值
,
其方差存在上确界和下确界
,
因此梯度消失和梯度
爆炸不可能出现
,
从而极大地提高了
BCIGM
的稳
定性
。
2.2.3
判别模型
判别模型的作用是通过特征提取判断输入样本
是否是真实样本
,
由全卷积网络构成
。
具体过程如
下
:
首先
,
输 入
256
p
ixel×256
p
ixel×3
的 样 本 图
像
,
包括真实样本与生成样本两类
;
接着
,
经过
6
个
卷积核大小为
5×5
,
步幅为
2
,
卷积核数目依 次为
64
,
128
,
256
,
512
,
1024
,
2048
的卷积
,
再通过
1
个卷
积核为
1×1
的卷积
;
最后
,
通过
Si
g
moid
激活函数
,
映射出输入样本概率
。
加入
1×1
的卷积核是由于
其可以在不改变特征图大小的情况下进行降维
,
减
少参数 的 个 数
,
从 而 降 低 计 算 时 间
。
判 别 模 型 如
图
3
所示
。
061002
-
3
剩余10页未读,继续阅读
王向庄
- 粉丝: 21
- 资源: 344
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0