基于SAH-Unet的高分辨率遥感影像不透水面提取方法

文档序号:34453669发布日期:2023-06-13 20:22阅读:156来源:国知局
基于SAH-Unet的高分辨率遥感影像不透水面提取方法

本发明涉及城市遥感影像数据的信息提取技术,具体是基于sah-unet的高分辨率遥感影像不透水面提取方法。


背景技术:

1、近年来,随着世界城市化进程的不断加快,造成了城镇面积不断扩张,引发了生物栖息地减少和退化、生物多样性丧失、地表下沉、水源污染等一系列环境问题。快速的城市化造成了不透水面面积增加,美国地质调查局(usgs)将不透水面定义为不允许水渗透的坚硬区域。具体而言,不透水面是指任何天然或人为造成的可以阻碍水源渗透,进而改变洪水径流、物质沉淀和污染剖面的物质,如覆盖有防水材料的建筑物屋顶、停车场和人行道等。总体而言,伴随着全球范围内城市化速度的不断增长,城市不透水面的扩张对城市区域的生态平衡、水文状况及自然生态环境均有着极为重要的影响。为了监测和评估城市可持续发展,2015年联合国提出了17项可持续发展目标(sdgs),其中sdg11即可持续城市和社区,具体指建设包容、安全、由抵御灾害能力和可持续的城市和人类住区。因此,实时且准确的自动提取不透水面数据对于城市规划以及环境和资源管理都十分重要,开展不透水面自动提取的相关研究对城市生态建设、监测城市动态及实现城乡地区的可持续发展均有着重要的意义。

2、早期的不透水面研究主要是通过人工测绘的方法,这种方式虽有着较高的精准度,但成本高、实时性差。相比于传统的测绘方式,遥感技术成本更低、实用性强、覆盖面广,故随着遥感卫星技术的快速发展,其已被广泛应用于不透水面提取的相关研究中,成为了城市可持续发展研究的重要途径。传统的利用遥感影像提取不透水面的方法是通过光谱分析和混合像素分解来分析不同地物的反射光谱特征的差异,如光谱混合分析法、指数法、回归分析法等。但由于数据分辨率及不同地物光谱干扰的影响,降低了不透水面提取的精度。


技术实现思路

1、本发明的目的在于解决现有利用遥感影像提取不透水面信息精度低的问题,提供了一种基于sah-unet的高分辨率遥感影像不透水面提取方法,其应用时能提升提取不透水面信息精度。

2、本发明的目的主要通过以下技术方案实现:

3、基于sah-unet的高分辨率遥感影像不透水面提取方法,包括如下步骤:

4、s1、获取目标区域高分辨率遥感影像和对应的osm数据,基于osm数据对高分辨率遥感影像进行标注,得到不透水面标签图像;

5、s2、对高分辨率遥感影像及对应不透水面标签图像进行数据预处理,得到不透水面样本数据集;

6、s3、构建用于高分辨率遥感影像特征提取的sah-unet模型,其中,sah-unet模型以u-net为骨干网络,在每个编码器的卷积计算之后引入cbam注意力模块,在解码器添加了支路径以结合上采样步骤中不同尺度的分类结果并进行反向传播和权重更新,采用深度可分离卷积代替u-net原有卷积运算;

7、s4、将步骤s2得到的目标区域不透水面样本数据集作为网络输入,通过最小化损失函数,利用神经网络优化器对sah-unet模型参数进行迭代优化,直至sah-unet模型准确检测高分辨率遥感影像中的不透水面;

8、s5、将待识别不透水面的目标高分辨率遥感影像输入训练得到的sah-unet模型中,提取影像融合特征并进行逐像素的地物类别预测,得到地物类别为不透水面的区域。

9、近些年,深度学习成为机器学习领域的热点之一,其特点是具有独特的自动特征学习能力和对非线性函数极强的表示和拟合能力,可以通过对低级特征的处理整合,生成更抽象的高级表示、属性或特征。由于其相对于传统机器学习算法的巨大优势,深度学习及相关方法已成功应用于各种计算机视觉任务,如图像分类、实例分割、目标检测等领域。其中卷积神经网络(cnn)因能自动的挖掘图像的相关上下文表征、深层次的学习抽象影像特征,逐渐已被应用到图像处理中。全卷积神经网络(fcn)的提出进一步将图像级分类延伸到像素级分类,极大的促进了语义分割类网络的发展。基于编码器(encoder)-解码器(decoder)架构的unet网络模型结合了反卷积与跳跃网络的特点,大量研究将其应用于遥感影像研究均取得了较为不错的效果。fpn是结合多层级特征来解决多尺度问题的特征金字塔模型,其通过高层特征向低层特征融合,增加底层特征的表达能力以提升网络性能,使得不同尺度的目标可以分配到不同层预测,达到分而治之的效果。deeplabv3网络架构增加了多尺度分割物体的模块,且设计了串行和并行的空洞卷积模块,采用多种不同的空洞率来获取多尺度的内容信息,提升了对多尺度物体实例分割的性能。linknet通过将编码器与解码器链接在一起的架构,在大规模减少参数量的同时也保证了网络模型的精度。pspnet网络通过基于不同区域的上下文聚合,提升了网络模型充分利用上下文信息的能力,提升了网络在不同场景解析任务下的性能。deeplabv3+架构在deeplabv3架构基的础上,加入了新的解码模块,更加精确的重构了影像分割中物体的边界。pan架构则是在fpn的基础上添加了一个自下而上的金字塔,将底层特征传递上去,使得模型既结合了语义信息又拥有定位信息,从而提升性能。与经典方法相比,深度学习方法具有独特的自动特征学习能力和对非线性函数极强的表示和拟合能力,可以通过对低级特征的处理整合,生成更抽象的高级表示、属性或特征,故在图像分割方面具有更好的性能。因此,利用深度学习方法可以解决高分辨率遥感影像的数据量大、地物类型复杂等问题,对于城市不透水面提取的研究具有实际意义。在网络模型用于不透水面提取方面,随着网络层次的加深,会丢失细小的不透水面和边缘等细节信息。此外由于高分辨遥感影像的拍摄的局限性,对于拍摄不全的地物,模型会出现错分、漏分的现象。为尽可能保留细节不透水面信息,达到更高精度的不透水面提取效果,本发明对网络模型进一步探索,本发明的sah-unet(small attention hybrid-unet)模型为多尺度融合网络模型,其以u-net为骨干网络,在每个编码器的卷积计算之后引入cbam(convolutional block attention module)注意力模块,以放大图像尺度上的重要特征并抑制相对不重要的特征;在解码器添加了支路径以结合上采样步骤中不同尺度的分类结果,使得模型可以在反向传播和权重更新过程中使用多尺度信息;最后,本发明在网络模型中使用深度可分离卷积代替普通卷积操作,从而在提取不透水面的多尺度特征时,在保证精度的同时大大减少网络模型参数的数量和计算量。如此,本发明保证对影像多尺度特征的提取能力,以适用于高分辨率遥感影像的不透水面自动提取。

10、为了保证标签的准确性,进一步的,所述步骤s1中基于osm数据对高分辨率遥感影像进行标注时,以osm数据作为掩膜数据并结合目视解译进行纠正,利用envi对影像不透水面区域进行标记,并与原始影像位置进行严格配准。

11、高分辨率的遥感影像具有极其丰富的空间、色彩和纹理特征,不同层次的特征信息为不透水面的提取提供了依据。但若将高分辨率遥感影像直接输入到网络模型中,会造成庞大的计算压力,导致计算机内存溢出。为尽可能保存所有影像信息,同时减缓计算压力,进一步的,所述步骤s2包括以下步骤:

12、将高分辨率遥感影像裁剪为图像块,并得到对应的不透水面标签图像块,再将对应裁剪得到的高分辨率遥感影像图像块和不透水面标签图像块作为样本,通过样本筛选、数据增强后,构建为不透水面样本数据集。其中,将高分辨率遥感影像裁剪为图像块,再作为信息输入到网络中,进而可针对少量相邻的像素点所包含的一些小而有意义不透水面的纹理及轮廓特征进行检测。

13、进一步的,所述数据增强的操作包括多角度翻转、镜像映射、色调增强、高斯模糊及添加噪声中的一种或多种方式。

14、进一步的,所述sah-unet模型中每个编码器的输入为来自前一个编码器经过卷积和最大池化下采样后的特征,经过注意力机制的特征通过跳跃连接与经过上采样地特征信息相连接。

15、进一步的,所述sah-unet模型对结合各编码器输出的特征图使用1×1的卷积核调整特征通道数,再进行softmax分类。

16、进一步的,所述步骤s4中采用的损失函数为dice loss函数。

17、进一步的,所述步骤s4中对sah-unet模型参数进行迭代优化包括以下步骤:利用反向传播与优化算法对sah-unet模型进行训练,训练过程中通过adam优化算法不断更新权值,使损失函数误差不断减小,直至模型趋于稳定。

18、进一步的,所述步骤s4采用早停策略,当验证损失在连续设定数量训练轮数没有改善时停止训练。

19、进一步的,所述步骤s5在目标高分辨率遥感影像尺寸大时,采用边缘重叠的方式进行分块裁剪得到相应的图像块,然后将图像块输入训练得到的sah-unet模型中得到输出的分类图块,再将得到的所有分类图块通过忽略边缘策略按序拼接,得到完整影像的地物类别分类结果,进而从中提取出地物类别为不透水面的区域。

20、sah-unet模型在原始unet模型上进行了扩展和改进。原始u-net网络由左侧encoder通道和右侧decoder通道构成,左侧encoder通道应用最大池化和卷积操作,将特征图进行大小减半和特征通道数量加倍。右侧decoder通道逐层进行上采样,逐步恢复图像细节和空间维度,并利用跳跃结构与左侧encoder通道对应层级的特征图进行融合。在sah-unet模型中,cbam被放置在每一个编码器的卷积计算后,以用来放大重要特征并抑制图像尺度上相对不重要的特征;在decoder部分增加了支路径,通过预测上采样步骤中不同尺度的分类结果,并进行反向传播和权重更新,使得模型在反向传播和权重更新中能利用多尺度信息,将各层的特征图应用于预测;此外将原本unet模型中的卷积运算全部更换为深度可分离卷积。本发明的sah-unet模型中每个编码器的输入为来自前一个编码器经过卷积和最大池化下采样后的特征,而不是应用过cbam的特征信息,这样是为了直到最后一个编码器都能尽可能地保留原始图像的特征。在后续网络中,经过注意力机制的特征通过跳跃连接与经过上采样地特征信息相连接。本发明在具体实施时,cbam注意力模块中的卷积仍然使用常规卷积。

21、高分辨率遥感影像一般是指分辨率在米级和亚米级的遥感影像,由于城市土地利用情况的复杂性以及不透水面材料的多样性,导致直接从高分辨率遥感影像中提取不透水面具有一定的挑战。针对从高分辨率遥感影像提取城市不透水面的需求,现有遥感不透水面提取研究中存在的精度较、效率和自动化程度方面的困境。本发明的构思是:综合利用人工智能方法的深度神经网络架构,将不透水面提取转化为深度学习网络模型构建与训练优化问题。以高分辨率遥感影像及其对应的不透水面标签图像作为基本输入单元,引入全局优化和类别空间关系信息作为约束,训练深度学习模型对不透水面进行精确提取。在该技术路线中,如何设计简单有效的深度学习网络模型的模型结构以及如何有效的训练该深度学习网络模型,使其能够准确地从复杂的遥感影像中提出出不透水面,是需要解决的主要问题。本发明中,基于u-net模型结合特征金字塔网络,对不透水面提取网络进行设计,提出了sah-unet网络模型,通过引入注意力机制和多尺度特征融合机制增强模型对不透水面的提取能力,并使用深度可分离卷积代替普通卷积操作以减少模型中的参数量,从而使得网络架构更适用于高分辨率遥感影像的不透水面自动提取;同时本发明基于提出的sah-unet网络模型,设计网络训练框架,以实现对模型训练策略的选取以及对网络超参数的配置。

22、综上所述,本发明与现有技术相比具有以下有益效果:

23、(1)本发明将当今应用广泛的深度学习方法引入到高分辨遥感影像的不透水面提取问题上来,将高分辨率遥感影像的不透水面提取转化为网络模型的构建与参数训练优化问题,为高分辨率遥感影像的不透水面提取提供了一种基于数据驱动的实施方向。

24、(2)本发明充分考虑高分辨率遥感影像具有高空间分辨率及丰富地物特征的相应特点,综合考虑计算机的内存管理压力及模型特征提取能力,基于u-net模型引入了注意力模块及多尺度特征融合机制,最后利用深度可分离卷积减少参数量,得到了sah-unet模型。实际效果表明,该模型能够增强对图像细节的处理能力且实现了多尺度的特征融合,在不占用太多内存和计算量的前提下提高了对高分辨遥感影像不透水面提取的精度。

25、(3)本发明通过以图像信息作为输入特征,利用网络模型的学习能力,主动学习数据中目标的特征,依据输入的图像数据来对地物和空间信息进行提取和分析,避免传了传统方法需要依据大量先验知识的缺陷。这种端到端的学习方式可以得到最优模型参数,降低了对先验知识和人为干预的依赖性,且能得到更高的不透水面提取精度,从而避免了特征选择过程中效率低、操作复杂等问题,实现了不透水面自动化提取,最终获得较精确的不透水面信息。本发明在总体精度(overall accuracy,oa)、召回率(recall)、f1分数(f1-score)、均交并比(meanintersection over union,miou)和准确率(precision)精度评价中均有提升,且操作简单易行,提取效果优秀。本发明对遥感不透水面精确和自动化提取研究提供示范和借鉴。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1