基于卷积神经网络的建筑物精细化提取.pdf
本文提出了一种基于卷积神经网络的建筑物精细化提取方法,旨在解决传统图像分割方法受图像模糊和噪声影响的缺陷。该方法包含建筑物定位、形状判断、形状匹配等步骤,能够获得精确的建筑物轮廓。
研究背景:
随着高分辨率卫星和航空遥感图像的不断涌现,从这些数据中自动检测或提取人工目标和结构已受到广泛关注。传统方法中,Kim T等人提出了基于投票策略的建筑物提取方法,CUI S Y等人提出了基于几何特征和灰度特征的建筑物提取方法,Croitoru A等人提出了基于城市建筑物几何规则的建筑物提取方法,Jung C R等人提出了基于窗口Hough变换的矩形屋顶提取方法,Kass M等人提出了Snake算法及其改进算法。
深度学习的发展:
近年来,深度学习发展迅速。在图像处理领域,卷积神经网络(CNN)在图像识别中取得了以往分类算法难以实现的惊人效果。CNN可以从少量预处理甚至原始数据中学习到抽象、本质和高级的特征,并对平移、旋转、缩放或其他形式的变形具有一定的不变性,已被广泛应用于车牌检测、人脸侦测、文字识别、目标跟踪、机器学习、计算机视觉等领域。
集成方法:
本文将一张高分辨率航空影像和一张DSM图像作为实验数据。集成方法中包含两种网络模型:用于计算对象是建筑物概率的回归模型和用于判断建筑物形状的分类模型。首先使用选择性搜索算法生成感兴趣区域(ROI)及其对应的图像,然后使用训练好的回归模型对每个ROI打分,并采用非极大值抑制算法得到建筑物对象;然后使用分类模型获得建筑物的形状;最后使用一种基于点集匹配的形状匹配方法获得准确的建筑物轮廓。
网络模型的训练:
CNN的工作过程分为前向传播和后向传播两个阶段。前向传播对输入图像数据进行多层卷积运算,再利用损失函数计算卷积结果得到损失值。反向传播是基于卷积反方向上损失值的传播,用于更新卷积核的权重。CNN模型可从低到高,从边缘、线条到矩形平面地识别对象。
回归模型:
本文提出了回归网络模型来评估一个ROI为建筑的概率。样本包括ROI的输入图像以及相应的LRaB。用于生成训练所需的ROI图像,常见的方法是提供一个固定大小的矩形框,沿着像素移动,再将图像裁剪为ROI图像然而,该方法有两个问题:ROI图像的数量太大和相邻区域对应的ROI图像非常相似,换言之,数据非常冗余。为此,参考文献[12]提出了选择性搜索算法,用于生成ROIs。选择性搜索利用基于图的图像分割算法生成基本区域,该分割方法通常是过分割的,但各分割区域内部具有非常好的同质性,局部细节保存也很好。
本文提出了一种基于卷积神经网络的建筑物精细化提取方法,能够获得精确的建筑物轮廓。该方法可以广泛应用于图像处理、计算机视觉、机器学习等领域。