一种基于卷积神经元网络和多边形规则化的建筑物轮廓自动提取算法的制作方法

文档序号:17940930发布日期:2019-06-18 23:05阅读:372来源:国知局
一种基于卷积神经元网络和多边形规则化的建筑物轮廓自动提取算法的制作方法

本发明涉及一种用于遥感影像建筑物提取的深度学习方法及建筑物多边形轮廓的规则化算法,可用于遥感影像建筑物提取、建筑物矢量边缘生成、建筑物变化检测等。



背景技术:

遥感影像建筑物自动化提取在城市规划、人口估计、地图制作与更新等应用中具有极为重要的意义。传统上,从航空/航天影像中提取建筑物的主要工作集中在:经验地设计一个恰当的特征以表达“什么是建筑物”,并创建相应的特征用于建筑物的自动识别和提取。常用的指标包括像素、光谱、长度、边缘、形状、纹理、阴影、高度、语义等等。而这些指标却会随着季节、光照、大气条件、传感器质量、尺度、建筑物风格和环境发生较明显的变化。因此,这种凭经验设计特征的方法常常只能处理特定的数据,而无法真正做到自动化。深度学习中的卷积神经网络在图像检索、图像分类、目标检测中展现出强大的性能。卷积神经网络可以自动学习一个多层的特征表达,将原始的输入图像映射为一元或多元的标签。这种自我学习特征的能力超越并逐渐代替了传统的人工经验设计特征的方法。建筑物提取不仅是个分类和语义分割问题,还是一个目标检测、实例分割问题。建筑物提取的目标并非关注某个像素是否为建筑物,更关注建筑物的数量、位置、形状。世界各地的绘图员的主要的、繁重的工作之一就是在航空/航天影像上手工勾勒建筑物矢量图,籍此生产各类地形图和专题图。因此,针对建筑物的矢量数据提取研究至关重要。



技术实现要素:

本发明针对现有技术的不足,提供了一种尺度鲁棒性强的神经网络,能够适应不同尺度的遥感影像建筑物提取,并对语义分割得到的建筑物边缘加入先验性知识进行规则化处理,得到高质量的规则建筑物多边形。

实现本发明目的采用的技术方案是,一种基于卷积神经元网络和多边形规则化的建筑物轮廓自动提取算法,包括如下步骤:

步骤1,根据已有的影像及建筑物覆盖矢量文件构建样本库;

步骤2,构建多尺度融合全卷积神经网络,并通过样本库对其进行训练,利用训练好的网络模型对遥感影像进行预测,得到遥感影像地表建筑物覆盖的分割结果;

步骤3,基于建筑物语义分割结果,进行建筑物边缘初始化,并获得初始矢量多边形;

步骤4,利用粗调整算法剔除错误的多边形和多边形错误的边、结点;

步骤5,利用规则化算法对矢量多边形进行规则化,得到规则的建筑物矢量边缘。

进一步的,步骤2中所述多尺度融合全卷积神经网络包括编码(encodingstage)、解码(decodingstage)以及输出(output)3个部分;其中编码部分由5个卷积层(convolutionlayer)、4个最大池化层(maxpoolinglayer)组成;解码部分由4个卷积层,4个反卷积层(deconvolutionlayer)组成;输出部分由4个子输出和1个主输出组成。

进一步的,所述编码部分的前两层卷积层由两组连续堆叠的卷积,修正线性单元(rectifiedlinearunit,relu)以及一个批量归一化层(batchnormalization,bn)组成;后三层卷积层由三组连续堆叠的卷积,修正线性单元(rectifiedlinearunit,relu)以及两个批量归一化层(batchnormalization,bn)组成;所述解码部分的前三个卷积层和最后一个卷积层分别由4组和3组连续堆叠的卷积(convolution),修正线性单元(rectifiedlinearunit,relu)组成;每个解码部分最后得到一个子输出,主输出通过串联解码部分每个尺度上最后的1通道的特征图,得到一个4通道的特征图,通过sigmoid函数激活得到最后的预测结果。

进一步的,步骤3中利用douglas-peucker算法进行边缘初始化,根据每个连通域的像素个数设置不同的限差阈值d,得到初始矢量多边形。

进一步的,步骤4的具体实现方式如下,

41)建筑物的边应具有一定的长度:剔除多边形小于td的边;

42)建筑物拐角不能过于尖锐或过于平缓:剔除小于α和大于β的角;

43)建筑物应该有一定的面积:删除面积小于s的多边形;

44)建筑物结点不应过多:剔除面积与结点个数的比值小于ta和周长与结点的个数比值小于tp的多边形。

进一步的,步骤5的具体实现方式如下,

51)确定建筑物的主方向:根据建筑物的面积设置不同的边长阈值w,长度大于w的边为长边,其余为短边,对于面积较小无法找到至少一条长边的建筑物依次将w减少w,直到找到至少一条长边;首先,将最长的一条边作为初始主方向,加入主方向列表中,将其余所有长边与主方向列表比较,如果该长边与所有主方向的夹角大于δmin且小于δmax,则将该长边的方向加入到主方向队列;

52)根据主方向调整多边形的边缘:首先将长边进行调整,将长边与主方向、主方向的垂直方向比较,得到最小的夹角,如果该夹角小于δmin,则将该长边以中点为旋转中心,旋转到最小夹角对应主方向的平行或垂直方向;然后进行短边调整,将短边与主方向、主方向的垂直方向比较,得到最小的夹角,如果该夹角小于ts,则将该短边以中点为旋转中心,旋转到最小夹角对应主方向的平行或垂直方向;

53)冗余平行线剔除和加入垂直线:调整完后的边缘可能存在连续两条边为平行线,依据建筑物面积设置不同的距离阈值d,如果连续平行线间的距离大于d,则在两平行线间加入一条垂线,否则,剔除长度较小的边;

54)依次计算连续两条边之间的交点,作为矢量多边形的结点,将所有结点依次连接,得到调整后的矢量多边形。

进一步的,步骤1的具体实现方式如下,

首先将影像对应的建筑物覆盖矢量文件转换成二值栅格图像,栅格图像像素值为图像像素的标签,其中0代表背景1为建筑物,将原始影像和对应的栅格标签裁剪成瓦片构建样本库。

本发明具有如下优点:多尺度融合全卷积神经网络尺度鲁棒性强,可适应不同尺度的遥感影像建筑物提取,可持续不断迭代优化;规则化算法可以适应多种情况下的矢量边缘,极大程度的减少人工绘制建筑物边缘的工作量。

附图说明

图1是本发明的样本库构建流程图。

图2是本发明的神经网络结构示意图。

图3是本发明的实施例数据范围图。

图4是本发明的实施例数据建筑物示意图。

图5是本发明的实施例结果示意图。

具体实施方式

下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。

本发明提供的一种基于卷积神经元网络和多边形规则化的建筑物轮廓自动提取算法,包括:步骤1,首先将影像对应的建筑物覆盖矢量文件转换成二值栅格图像,栅格图像像素值为图像像素的标签,其中0代表背景1为建筑物,将原始影像和对应的栅格标签裁剪成瓦片构建样本库;步骤2,对多尺度融合全卷积神经网络(multi-scaleaggregationfullconvolutionalneuralnetwork,ma-fcn)进行训练,学习遥感影像中建筑物的特征;网络模型训练结束后,利用训练好网络模型对遥感影像进行预测,得到遥感影像地表建筑物覆盖的分割结果;步骤3,基于建筑物语义分割结果,利用douglas-peucker算法进行建筑物边缘初始化;步骤4,利用粗调整算法剔除错误的多边形和多边形错误的边、结点;步骤5,利用规则化算法对矢量多边形进行规则化,得到规则的建筑物矢量边缘。

上述的多尺度融合全卷积神经网络包括编码(encodingstage)、解码(decodingstage)以及输出(output)3个部分。编码部分由5个卷积层(convolutionlayer)、4个最大池化层(maxpoolinglayer)组成;解码部分由4个卷积层,4个反卷积层(deconvolutionlayer)组成;输出部分由4个子输出和1个主输出组成。

上述编码部分的前两层卷积层由两组连续堆叠的卷积,修正线性单元(rectifiedlinearunit,relu)以及一个批量归一化层(batchnormalization,bn)组成;后三层卷积层由三组连续堆叠的卷积,修正线性单元(rectifiedlinearunit,relu)以及两个批量归一化层(batchnormalization,bn)组成。卷积核大小均为3×3,卷积步长均为1。

上述编码部分的最大池化层步长为2×2,经过池化层后,输出特征图的高度与宽度变为输入的二分之一。

上述解码部分的每一个卷积层,其输入为反卷积后得到的特征图与编码部分对应大小特征图的串联。

上述解码部分的前三个卷积层和最后一个卷积层分别由4组和3组连续堆叠的卷积(convolution),修正线性单元(rectifiedlinearunit,relu)组成。卷积核大小均为3×3,卷积步长均为1。每个解码部分最后得到一个子输出。卷积层最后得到的1通道的特征图,由sigmoid函数激活得到对应尺度的子预测图。

主输出部分通过串联解码部分每个尺度上最后的1通道的特征图,得到一个4通道的特征图,通过sigmoid函数激活得到最后的预测结果。

步骤3中,得到建筑物语义分割结果后,利用douglas-peucker算法进行边缘初始化,根据每个连通域的像素个数设置不同的限差阈值d,得到初始矢量多边形。

步骤4中,对于初始多边形利用粗调整算法进行调整:

41)建筑物的边应具有一定的长度:剔除多边形小于td的边;

42)建筑物拐角不能过于尖锐或过于平缓:剔除小于α和大于β的角;

43)建筑物应该有一定的面积:删除面积小于s的多边形,;

44)建筑物结点不应过多:剔除面积与结点个数的比值小于ta和周长与结点的个数比值小于tp的多边形。

步骤5中,对于粗调整后的多边形进行细调整:

51)确定建筑物的主方向。根据建筑物的面积设置不同的边长阈值w,长度大于w的边为长边,其余为短边。对于面积较小无法找到至少一条长边的建筑物依次将w减少w,直到找到至少一条长边。首先,将最长的一条边作为初始主方向,加入主方向列表中。将其余所有长边与主方向列表比较,如果该长边与所有主方向的夹角大于δmin且小于δmax,则将该长边的方向加入到主方向队列。

52)根据主方向调整多边形的边缘。首先将长边进行调整。将长边与主方向、主方向的垂直方向比较,得到最小的夹角。如果该夹角小于δmin,则将该长边以中点为旋转中心,旋转到最小夹角对应主方向的平行或垂直方向。然后进行短边调整。将短边与主方向、主方向的垂直方向比较,得到最小的夹角。如果该夹角小于ts,则将该短边以中点为旋转中心,旋转到最小夹角对应主方向的平行或垂直方向。

53)冗余平行线剔除和加入垂直线。调整完后的边缘可能存在连续两条边为平行线。依据建筑物面积设置不同的距离阈值d,如果连续平行线间的距离大于d,则在两平行线间加入一条垂线。否则,剔除长度较小的边。

54)依次计算连续两条边之间的交点,作为矢量多边形的结点。将所有结点依次连接,得到调整后的矢量多边形。

实施例:

参见图1和图2,本发明利用多尺度融合全卷积神经网络(multi-scaleaggregationfullconvolutionalneuralnetwork,ma-fcn)学习高分辨率遥感影像中的建筑物特征,然后对遥感影像建筑物覆盖进行像素级预测。为了训练神经网络模型,首先需要获取训练样本,附图1展示了构建训练样本库的流程。首先对遥感影像进行裁剪与重采样,得到分辨率合适、具备建筑物覆盖数据的影像范围。然后将影像范围内对应的建筑物矢量数据栅格化,使其与影像分辨率一致。最后,结合计算机性能、地物大小等因素,将遥感影像与对应的标签数据分割为大小适宜(如256×256像素,或512×512像素)的样本块。附图3为样本库数据整体范围,其中虚线框图像用来训练,实线框中图像用来测试。附图4为部分建筑物示例。

获得训练数据后,对神经网络进行迭代训练,直到模型最优。模型训练完成后,将待分类的遥感影像切割为与训练样本大小一致的影像块,利用训练好的模型对影像块进行建筑物提取,即可得到遥感影像建筑物分割结果。最后将所有影像块的预测结果拼接,便可得到完整影像的建筑物分割图。

得到建筑物语义分割图后,根据图像设置合适的参数,利用douglas-peucker算法进行建筑物边缘矢量初始化。设置参数对初始化后的矢量多边形粗调整。设置合适的参数对粗调整后的多边形进行细调整,得到最后规则化的矢量结果。在试验数据上,设置α=π/6,β=π/18,s=20,ta=1,tp=1.5,td=0.5,w=0.2,δmin=π/12,δmax=5π/12,ts=π/4,d设置为:其中n为像素个数;w和d为:其中s为建筑物面积。

附图5为最后的结果示例,第一列为原始影像和建筑物边缘示例,第二列为影像通过多尺度融合全卷积神经网络得到的分割结果,第三列为通过douglas-peucker算法得到的初试边缘,第四列为通过规则化算法后得到的规则化边缘。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1