遥感分类卷积神经网络的关键卷积层超参数确定方法与流程

文档序号：11678189阅读：499来源：国知局

本发明涉及遥感分类领域，具体涉及一种遥感分类卷积神经网络的关键卷积层超参数确定方法。

背景技术：

通过遥感影像进行地理目标识别是遥感技术运用于实际问题的一个重要环节，无论是专题信息提取、动态变化监测、专题制图，还是遥感数据库建设等都离不开遥感影像分类技术。面向对象遥感技术集合众多临近像元组成一定语义的空间影像对象，它综合遥感数据中蕴含的空间、纹理和光谱信息，其核心为影像对象构建和影像对象分类，卷积神经网络是深度学习算法中的一种，该算法受视觉系统的启发，通过权值共享来降低参数复杂度以及以图像的局部视野域作为分层结构的输入，使图像保持了平移、缩放和旋转的不变性。在图像识别领域，卷积神经网络取得了不错的效果。但是将卷积神经网络应用到遥感影像分类，依然存在如何根据不同分辨率输入遥感影像确定卷积神经网络超参数(卷积核大小和步长)的问题。

技术实现要素：

本发明要解决的技术问题是：提供一种遥感分类卷积神经网络的关键卷积层超参数确定方法，能够节约算法所需要的时间，提高其面向对象遥感分类精度。

本发明为解决上述技术问题所采取的技术方案为：一种遥感分类卷积神经网络的关键卷积层超参数确定方法，其特征在于：它包括以下步骤：

卷积神经网络样本集的构建：

对获取的研究区域的遥感影像进行数据处理，得到具有若干个inputsize*inputsize大小的遥感影像对象的样本集合，将样本集合分为训练集和验证集，训练集和样本集中各地物类别数目比例一致；

卷积神经网络结构的构建：设计卷积层和降采样层的个数与排布顺序；

卷积神经网络关键层超参数的确定：选定其中一个卷积层为关键层，预设关键层卷积核大小kernelsize1，计算卷积尺度kernel1scale＝inputsize/kernelsize1；

根据inputsize和kernel1scale，按照以下设置规则计算卷积步长stride：

规则1、如果kernel1scale<a1并且inputsize>b1，则stride设为1，并考虑兼容关系；

规则2、如果a1<＝kernel1scale<＝a2并且inputsize<b1，则stride设为2或1，并考虑兼容关系；

规则3、如果a1<＝kernel1scale<＝a2并且b1<＝inputsize<b2，则stride设为3，并考虑兼容关系；

规则4、如果kernel1scale>a2并且inputsize<b2，则stride设为3，并考虑兼容关系；

所述的a1、a2、b1、b2为预设参数；所述的兼容关系为：1)对于关键层卷积得到输出特征图大小outputsize，若后续降采样大小分别为s1、s2、s3、……、sn，则设计关键层输出特征图大小的方式如下：outputsize＝k*s1*s2*s3*……*sn，k为最后一层特征图的大小；2)kernelsize1＝[inputsize-(outputsize-1)*stride]+2*padsize，padsize为补零数目；

其它卷积层参数的确定：预设其它卷积层卷积核为kernelsize，其它卷积层卷积步长为1，padsize＝(kernelsize-1)/2；

降采样层参数的确定：后续降采样大小采用均值降采样或最大值降采样。

按上述方案，所述的卷积神经网络结构包括3层卷积层和3层采样层，具体顺序为第一卷积层、第一降采样层、第二卷积层、第二降采样层、第三卷积层、第三降采样层；所述的关键层为第一卷积层。

按上述方案，所述的a1＝20，a2＝40，b1＝100，b2＝200。

按上述方案，所述的训练集和验证集中的样本比例为4比1。

一种遥感分类方法，其特征在于：它包括以下步骤：

数据获取和预处理：获取研究区域的遥感影像，并进行预处理，预处理包括几何校正、大气校正和裁剪拼接；

地类确定：根据研究目的，结合研究区域实地调察，选择需要分类的地类；

遥感影像多尺度分割：利用面向对象遥感影像分类专业软件对遥感影像进行多尺度分割；

最优分割尺度选择：根据所选择的地类，选择其对应的最优分割尺度和最优分割参数；

影像对象提取：在对应的最优分割尺度上提取相应的矢量对象，用矢量对象裁剪整幅遥感影像，获得遥感影像对象；

影像对象邻域提取：计算所有遥感影像对象的最小外包矩形的长和宽，取长和宽中的最大值lmax作为输入影像的长度，以遥感影像对象中心像元为中心，将所有遥感影像对象扩展成m*m大小，m＝lmax/影像分辨率，扩展像元值为以遥感影像对象中心像元为中心的m*m邻域像元值；

卷积神经网络样本集的构建：将m*m的遥感影像对象重采样成inputsize*inputsize大小的遥感影像对象，得到具有若干个inputsize*inputsize大小的遥感影像对象的样本集合，将样本集合分为训练集和验证集，训练集和样本集中各地物类别数目比例一致；

卷积神经网络结构的构建：设计卷积层和降采样层的个数与排布顺序；

卷积神经网络关键层超参数的确定：选定其中一个卷积层为关键层，预设关键层卷积核大小kernelsize1，计算卷积尺度kernel1scale＝inputsize/kernelsize1；

根据inputsize和kernel1scale，按照以下设置规则计算卷积步长stride：

规则1、如果kernel1scale<a1并且inputsize>b1，则stride设为1，并考虑兼容关系；

规则2、如果a1<＝kernel1scale<＝a2并且inputsize<b1，则stride设为2或1，并考虑兼容关系；

规则3、如果a1<＝kernel1scale<＝a2并且b1<＝inputsize<b2，则stride设为3，并考虑兼容关系；

规则4、如果kernel1scale>a2并且inputsize<b2，则stride设为3，并考虑兼容关系；

其它卷积层参数的确定：预设其它卷积层卷积核为kernelsize，其它卷积层卷积步长为1，padsize＝(kernelsize-1)/2；

降采样层参数的确定：后续降采样大小采用均值降采样或最大值降采样；

基于卷积神经网络进行面向对象遥感影像分类：基于所述的训练集对于卷积神经网络进行训练，并在所述的验证集上验证精度。

按上述分类方法，所述的卷积神经网络结构包括3层卷积层和3层采样层，具体顺序为第一卷积层、第一降采样层、第二卷积层、第二降采样层、第三卷积层、第三降采样层；所述的关键层为第一卷积层。

按上述分类方法，所述的a1＝20，a2＝40，b1＝100，b2＝200。

按上述分类方法，所述的训练集和验证集中的样本比例为4比1。

本发明的有益效果为：

1、提出了基于影像输入大小和卷积核大小，提出卷积尺度的概念，这与遥感空间尺度相适应，并在此基础之上，提供了一种基于输入大小和卷积尺度联合确定关键层超参数的方法，能够减少算法调参所需要的时间，提高面向对象遥感分类精度。

2、提出将不同网络的除关键层卷积层，其他卷积层和降采样超参数的设置方法，通过此种方法，才能分析卷积神经网络输入和关键层超参数对于卷积神经网络用于面向对象遥感分类精度的影响。

附图说明

图1为本发明一实施例的方法流程图。

图2为遥感影像对象提取过程示意图。

图3为影像对象邻域提取前后的对比图。

具体实施方式

下面结合具体实例和附图对本发明做进一步说明。

本发明旨在解决如何根据不同分辨率输入遥感影像确定卷积神经网络超参数(卷积核大小和步长)的问题，提供一种基于影像输入进行面向对象遥感分类卷积神经网络的关键层超参数确定方法，而在卷积神经网络中，第一层超参数显得尤为关键，卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，但是它决定了更多层的网络能否从低级特征中迭代提取更复杂的特征，换言之，第一层提取特征信息含量越高和特征间越独立，后续卷积层越能提取复杂可靠的特征。

本发明提供一种遥感分类卷积神经网络的关键卷积层超参数确定方法，它包括以下步骤：

卷积神经网络样本集的构建：

对获取的研究区域的遥感影像进行数据处理，得到具有若干个inputsize*inputsize大小的遥感影像对象的样本集合，将样本集合分为训练集和验证集，训练集和样本集中各地物类别数目比例一致；本实施例中将样本集合中4/5的样本作为训练集，其余1/5作为验证集。

卷积神经网络结构的构建：设计卷积层和降采样层的个数与排布顺序。本实施例中，所述的卷积神经网络结构包括3层卷积层和3层采样层，具体顺序为第一卷积层、第一降采样层、第二卷积层、第二降采样层、第三卷积层、第三降采样层；所述的关键层为第一卷积层。

卷积神经网络关键层超参数的确定：选定其中一个卷积层为关键层，预设关键层卷积核大小kernelsize1，计算卷积尺度kernel1scale＝inputsize/kernelsize1；

根据inputsize和kernel1scale，按照以下设置规则计算卷积步长stride：

规则1、如果kernel1scale<a1并且inputsize>b1，则stride设为1，并考虑兼容关系；

规则2、如果a1<＝kernel1scale<＝a2并且inputsize<b1，则stride设为2或1，并考虑兼容关系；

规则3、如果a1<＝kernel1scale<＝a2并且b1<＝inputsize<b2，则stride设为3，并考虑兼容关系；

规则4、如果kernel1scale>a2并且inputsize<b2，则stride设为3，并考虑兼容关系；

所述的a1、a2、b1、b2为预设参数，本实施例中a1＝20，a2＝40，b1＝100，b2＝200；所述的兼容关系为：1)对于关键层卷积得到输出特征图大小outputsize，若后续降采样大小分别为s1、s2、s3、……、sn，则设计关键层输出特征图大小的方式如下：outputsize＝k*s1*s2*s3*……*sn，k为最后一层特征图的大小；2)kernelsize1＝[inputsize-(outputsize-1)*stride]+2*pad，padsize为补零数目；

其它卷积层参数的确定：预设其它卷积层卷积核为kernelsize，其它卷积层卷积步长为1，padsize＝(kernelsize-1)/2；

降采样层参数的确定：后续降采样大小采用均值降采样或最大值降采样。

一种遥感分类方法，如图1所示，它包括以下步骤：

s1、数据获取和预处理：获取研究区域的遥感影像，并进行预处理，预处理包括几何校正、大气校正和裁剪拼接；本实施例获取的是杭州市西湖区的高分辨率影像为实验数据，利用遥感影像软件(envi、arcgis等)对实验数据进行影像预处理。

s2、地类确定：根据研究目的，结合研究区域实地调察，选择需要分类的地类。根据研究目的，本实例涉及地物类型有：有林地、绿地、水体、住宅、道路等。

s3、遥感影像多尺度分割：利用面向对象遥感影像分类专业软件对遥感影像进行多尺度分割。面向对象遥感影像分类专业软件内嵌入多种分割算法，比如棋盘算法、多阈值分割算法、分形网络演化算法等等。本实施例使用的ecognication软件，多尺度分割算法采用分形网络演化算法。

s4、最优分割尺度选择：根据所选择的地类，选择其对应的最优分割尺度和最优分割参数。常用的最优分割尺度的选择方法：经验选择法、最大面积法、地物综合法、方差变异法、目标函数法等。最优分割参数常采用反复实验法。最优分割参数为形状因子0.9，紧致度因子设为0.8，光滑度因子设为0.2。本实施例使用的是基于经验选择方法确定各地类的最优分割尺度。以下表1是各地类对应的最佳分割尺度示例表：

表1各地类对应的最佳分割尺度

s5、影像对象提取：在对应的最优分割尺度上提取相应的矢量对象，用矢量对象裁剪整幅遥感影像，获得遥感影像对象；为保持样本均衡，各地类提取数目应比较均衡，本实施例提取样本2500个。如图2所示，(a)为矢量对象，(b)为整幅遥感影像，(c)为遥感影像对象。

s6、影像对象邻域提取：计算所有遥感影像对象的最小外包矩形的长和宽，取长和宽中的最大值lmax作为输入影像的长度，以遥感影像对象中心像元为中心，将所有遥感影像对象扩展成m*m大小，m＝lmax/影像分辨率，扩展像元值为以遥感影像对象中心像元为中心的m*m邻域像元值；本实施例中通过计算，m为192。如图3所示，(a)为邻域提取前，(b)为邻域提取后。

s7、卷积神经网络样本集的构建：将m*m的遥感影像对象重采样成inputsize*inputsize大小的遥感影像对象，得到具有若干个inputsize*inputsize大小的遥感影像对象的样本集合，将样本集合分为训练集和验证集，训练集和样本集中各地物类别数目比例一致；本实施例中将192*192的遥感影像对象重采样成192*192，96*96，48*48。训练集共有2000个样本，验证集共有500个样本。其中训练集每个地类有400样本，其中训练集每个地类有100样本，保持样本比例均衡。

s8、卷积神经网络结构的构建：设计卷积层和降采样层的个数与排布顺序；本实施例中卷积神经网络结构包括3层卷积层和3层采样层，具体顺序为第一卷积层、第一降采样层、第二卷积层、第二降采样层、第三卷积层、第三降采样层。

s9、卷积神经网络关键层超参数的确定：选定其中一个卷积层为关键层，预设关键层卷积核大小kernelsize1，计算卷积尺度kernel1scale＝inputsize/kernelsize1；本实施例中所述的关键层为第一卷积层，输入inputsize为192，kernelsize1为5，kernel1scale为38.4，当输入inputsize为48或96时，kernelsize1为2或3时，方法同理。

根据inputsize和kernel1scale，按照以下设置规则计算卷积步长stride：

规则1、如果kernel1scale<a1并且inputsize>b1，则stride设为1，并考虑兼容关系；

规则2、如果a1<＝kernel1scale<＝a2并且inputsize<b1，则stride设为2或1，并考虑兼容关系；

规则3、如果a1<＝kernel1scale<＝a2并且b1<＝inputsize<b2，则stride设为3，并考虑兼容关系；

规则4、如果kernel1scale>a2并且inputsize<b2，则stride设为3，并考虑兼容关系；

本实施例中，当输入inputsize是192，kernel1scale为38.4，满足规则4：20<＝kernel1scale<＝40，100<＝inputsize<200，步长stride设为3。当输入为48或96时，设计卷积核大小kernelsize为2或3时方法同理。为验证方法的有效性，本实例增加了对比实验，实验如表2所示。

表2：卷积层卷积核不同大小和同步长的卷积神经网络设计表

上表中，output表示outputsize，pad表示padsize，kernel为卷积核的大小。

s10、其它卷积层参数的确定：预设其它卷积层卷积核为kernelsize，其它卷积层卷积步长为1，padsize＝(kernelsize-1)/2，padsize为补零数目；可以保持输入大小和输出大小保持保持一致。本实施例第二卷积层和第三卷积层采取如下参数：步长stride为1，补零padsize设置为2，卷积核大小设置5。

s11、降采样层参数的确定：后续降采样大小采用均值降采样或最大值降采样；本实施例如下参数：降采样大小设计为2，采用均值降采样。

s12、基于卷积神经网络进行面向对象遥感影像分类：基于所述的训练集对于卷积神经网络进行训练，并在所述的验证集上验证精度。表3和表4为当卷积核卷积层1大小为2、3、5、6时，不同网络分类精度。(括号内为卷积核大小)。

表3当卷积核卷积层1大小为5或6时，不同网络分类精度

表4当卷积核卷积层1大小为5或6时，不同网络分类精度

从表3和表4，我们可以得知，

满足规则1有：

当输入为48*48，卷积核大小为3*3，计算卷积尺度为16，满足规则1，卷积步长设为1，其分类精度为0.916；

当输入为48*48，卷积核大小为6*6，计算卷积尺度为8，满足规则1，卷积步长设为1其分类精度为0.946；

当输入为96*96，卷积核大小为6*6，计算卷积尺度为16，满足规则1，卷积步长设为1，其分类精度为0.942。

满足规则2有：

当输入为48*48，卷积核大小为2*2，计算卷积尺度为24，满足规则1，考虑兼容关系，第一层卷积层输出大小为8的倍数，卷积步长设为2，其分类精度为0.932；

当输入为96*96，卷积核大小为3*3，计算卷积尺度为24，满足规则1，考虑兼容关系，第一层卷积层输出大小为8的倍数，卷积步长设为1，其分类精度为0.92。

满足规则3有：

当输入为192*192，卷积核大小为6*6，计算卷积尺度为32，满足规则3，考卷积步长设为3，其分类精度为0.92。

满足规则4有：

当输入为96*96，卷积核大小为2*2，计算卷积尺度为48，满足规则4，考卷积步长设为2，其分类精度为0.926；

当输入为192*192，卷积核大小为2*2，计算卷积尺度为96，满足规则4，考卷积步长设为2，其分类精度为0.926。

以上实施例仅用于说明本发明的设计思想和特点，其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施，本发明的保护范围不限于上述实施例。所以，凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰，均在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔巍;郑振东;周琪
技术所有人：武汉理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。