基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法

文档序号:33709822发布日期:2023-03-31 23:13阅读:39来源:国知局
基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法

1.本发明涉及深度学习技术领域,具体涉及基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法。


背景技术:

2.大跨高速铁路(高铁)桥梁在长期服役过程中会发生性能退化,导致桥梁结构的安全性能降低,严重威胁到人们的生命和财产安全。进行高铁桥梁状态评估,可以有效地识别桥梁的性能退化程度、提前预防灾害的发生,是保障高铁桥梁安全运营的重要手段。表面开裂是桥梁结构损坏的重要早期指标,进行表观裂缝的识别是高铁桥梁状态评估的重要任务。
3.传统的人工检测方法成本高昂,且人工高空作业存在安全隐患,难以高效进行在大范围的高铁桥梁检测。近年来,基于深度学习的计算机视觉技术得到了飞速的发展,并成功应用到结构表观裂缝识别等领域,可以极大地促进高铁桥梁表观裂缝识别自动化实施。然而,用于表观裂缝计算机视觉识别的深度学习模型需要大量的带标签裂缝数据集进行训练,才能达到足够的识别精度。在实际工程中,建立庞大的训练数据集通常都比较困难,对数据集进行标签的成本比较昂贵。相比传统的训练方法,主动学习方法可以利用相当少的训练数据训练深度学习模型,却能得到足够高的识别精度。然而,现有的基于表达和基于不确定性的主动学习方法,未能较好地平衡主动学习过程中的探索和利用,容易出现抽样局部最优问题,导致主动学习的效率较低,造成了训练数据集的浪费。


技术实现要素:

4.本发明的目的在于克服上述技术不足,提供一种基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法,能够解决现有技术中高速铁路桥梁表观裂缝识别主动学习中的抽样局部最优的技术问题,提高高速铁路桥梁表观裂缝识别的效率和精度。
5.为达到上述技术目的,第一方面,本发明的技术方案提供一种基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法,包括以下步骤:
6.获取高铁桥梁表观裂缝图片数据集,从所述图片数据集中选择候选数据集,并从所述候选数据集中选择当前子集;
7.采用随机抽样的方式从所述候选数据集中选取多个样本作为新的训练样本,对所述训练样本进行标记,添加到训练集中;
8.使用所述训练集更新裂缝识别的深度神经网络模型,计算在相邻两次迭代训练过程中所述深度神经网络模型对所述图片数据集预测结果的相对损失;
9.若连续在多次迭代中所述图片数据集预测结果的相对损失小于第一容许值,所述深度神经网络模型收敛;
10.保存所述深度神经网络模型,并使用所述深度神经网络模型进行高铁桥梁表观裂缝识别。
11.与现有技术相比,本发明的有益效果包括:
12.本发明目提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方,根据样本的不确定性,采用整体到局部的策略,从高铁桥梁表观裂缝数据集中选择子集和训练样本,训练裂缝识别的深度神经网络模型;采用相邻两次迭代中模型对图片数据集的预测结果计算相对损失,由此进行模型收敛和子集收敛判别。本发明根据子集收敛衡量深度神经网络模型的全局预测精度,自适应地缩小抽样范围,平衡主动学习过程中的探索和利用;根据模型收敛作为主动学习的终止条件,能有效提高高速铁路桥梁表观裂缝识别的效率和精度。
13.根据本发明的一些实施例,若所述深度神经网络模型未满足收敛条件,采用上一次迭代中所述深度神经网络模型对所述当前子集的预测标签作为真实标签,采用当前迭代的所述深度神经网络模型预测所述当前子集的预测标签;
14.根据所述真实标签、所述预测标签和网络的损失函数计算两次迭代中所述当前子集预测结果的相对损失,判断所述当前子集是否满足收敛条件;
15.当连续若干次迭代中所述当前子集预测结果的相对损失小于第二容许值,所述当前子集满足收敛条件,将所述当前子集从所述候选数据集中删除,以缩小主动学习的搜索范围;
16.采用深度神经网络模型预测所述候选数据集的样本,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新所述候选数据集的样本的不确定性。
17.根据本发明的一些实施例,在判断所述当前子集是否满足收敛条件之后,包括步骤:
18.若当前子集未满足收敛条件,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新所述候选数据集的样本的不确定性。
19.根据本发明的一些实施例,计算所述深度神经网络模型在相邻两次迭代训练过程中所述图片数据集预测结果的相对损失,包括步骤:
20.采用上一次迭代中所述深度神经网络模型对所述图片数据集的预测标签作为真实标签,采用当前迭代的所述深度神经网络模型预测所述图片数据集的预测标签,然后根据所述真实标签、所述预测标签和所述深度神经网络模型的损失函数计算两次迭代中数据集的相对损失。
21.根据本发明的一些实施例,所述深度神经网络模型的损失函数包括dice loss损失函数和交叉熵损失函数两个部分;
22.其中d i ce loss损失函数定义为:
[0023][0024]
式中,s
ip
和s
ig
分别为预测和真实的像素分类,n为像素总数;
[0025]
交叉熵损失函数的定义为:
[0026]
[0027]
x为输入也是深度神经网络模型的最后一层的输出,class为像素真实的标签索引值;
[0028]
所述深度神经网络模型的损失函数为:
[0029]
loss=loss
ce
+loss
dice

[0030]
根据本发明的一些实施例,
[0031]
根据本发明的一些实施例,基于预测结果的信息熵计算候选数据集样本的不确定性,包括:
[0032]
基于信息熵的不确定性计算公式为:
[0033][0034]
p(si)为像素被预测为i类的概率,n为类别总数,n为样本图片的像素总数。
[0035]
根据本发明的一些实施例,在更新所述候选数据集的样本的不确定性之后,包括步骤:
[0036]
根据样本的不确定性,从候选数据集中选取不确定性最小的前ns个样本作为新的当前子集,其中ns定义为:
[0037]ns
=psnc[0038]
ps为比例系数,nc为剩余的候选数据集样本数。
[0039]
根据本发明的一些实施例,若连续在多次迭代中所述图片数据集预测结果的相对损失小于第一容许值,所述深度神经网络模型收敛,包括步骤:
[0040]
若连续在两次迭代中所述图片数据集预测结果的相对损失小于所述第一容许值,所述第一容许值为0.15,所述深度神经网络模型收敛。
[0041]
根据本发明的一些实施例,当连续若干次迭代中所述当前子集预测结果的相对损失小于第二容许值,所述当前子集满足收敛条件,包括步骤:
[0042]
当连续一次迭代中所述当前子集预测结果的相对损失小于第二容许值,所述第二容许值为0.3,所述当前子集满足收敛条件。
[0043]
第二方面,本发明提供了一种基于自适应子集搜索和深度学习的桥梁表观裂缝识别系统,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任意一项所述的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法。
[0044]
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
[0045]
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中摘要附图要与说明书附图的其中一幅完全一致:
[0046]
图1为本发明一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的流程图;
[0047]
图2为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的流程图;
[0048]
图3为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的流程图;
[0049]
图4为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的计算机视觉模型示意图;
[0050]
图5为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的原始表观裂缝图片;
[0051]
图6为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的预测表观裂缝图片;
[0052]
图7为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的裂缝预测d i ce系数收敛过程。
具体实施方式
[0053]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0054]
需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0055]
本发明提供了一种基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法,采用整体到局部的抽样策略,从高铁桥梁表观裂缝数据集中选择子集和训练样本,训练裂缝识别的深度神经网络模型;根据模型收敛作为主动学习的终止条件,能有效提高高速铁路桥梁表观裂缝识别的效率和精度。本发明能够有效地平衡主动学习过程中的探索和利用,避免抽样局部最优问题,具有更高的抽样效率和裂缝识别精度。
[0056]
下面结合附图,对本发明实施例作进一步阐述。
[0057]
参照图1和图2,图1为本发明一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的流程图;图2为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的流程图;基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括但是不仅限于以下步骤:
[0058]
步骤s110,获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;
[0059]
步骤s120,采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;
[0060]
步骤s130,使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;
[0061]
步骤s140,若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;
[0062]
步骤s150,保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0063]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0064]
本实施例提供了一种基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法,采用整体到局部的抽样策略,从高铁桥梁表观裂缝数据集中选择子集和训练样本,训练裂缝识别的深度神经网络模型;本发明根据样本的不确定性,采用整体到局部的抽样策略,从高铁桥梁表观裂缝数据集中选择子集和训练样本,训练裂缝识别的深度神经网络模型;采用相邻两次迭代中的模型对数据的预测结果计算相对损失,由此进行模型收敛和子集收敛判别。根据子集收敛衡量深度神经网络模型的全局预测精度,自适应地缩小抽样范围,平衡主动学习过程中的探索和利用;根据模型收敛作为主动学习的终止条件,能有效提高高速铁路桥梁表观裂缝识别的效率和精度。相比现有的方法,本发明能够有效地平衡主动学习过程中的探索和利用,避免抽样局部最优问题,具有更高的抽样效率和裂缝识别精度。
[0065]
参照图3,图3为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的流程图;基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括但是不仅限于以下步骤:
[0066]
步骤s210,若深度神经网络模型未满足收敛条件,采用上一次迭代中深度神经网络模型对当前子集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测当前子集的预测标签;
[0067]
步骤s220,根据真实标签、预测标签和网络的损失函数计算两次迭代中当前子集预测结果的相对损失,判断当前子集是否满足收敛条件;
[0068]
步骤s230,当连续若干次迭代中当前子集预测结果的相对损失小于第二容许值,当前子集满足收敛条件,将当前子集从候选数据集中删除,以缩小主动学习的搜索范围;
[0069]
步骤s240,采用深度神经网络模型预测候选数据集的样本,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新候选数据集的样本的不确定性。
[0070]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0071]
若深度神经网络模型未满足收敛条件,采用上一次迭代中深度神经网络模型对当前子集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测当前子集的预测标签;根据真实标签、预测标签和网络的损失函数计算两次迭代中当前子集预测结果的相对损失,判断当前子集是否满足收敛条件;当连续若干次迭代中当前子集预测结果的相对
损失小于第二容许值,当前子集满足收敛条件,将当前子集从候选数据集中删除,以缩小主动学习的搜索范围;采用深度神经网络模型预测候选数据集的样本,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新候选数据集的样本的不确定性。
[0072]
参照图4至图7,图4为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的计算机视觉模型示意图;图5为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的原始表观裂缝图片;图6为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的预测表观裂缝图片;图7为本发明另一个实施例提供的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法的裂缝预测d i ce系数收敛过程。
[0073]
(1)在一实施例中,利用一种基于自适应子集搜索和深度学习的高速铁路桥梁表观裂缝识别方法进行高铁桥梁表观裂缝识别。
[0074]
(2)首先准备高铁桥梁表观裂缝数据集。可以通过现场拍摄获取原始的数据集。然后对数据进行裁剪、转化等预处理,使得每一个图片样本是3通道的rgb图片,将所有样本调整为3
×
256
×
256的分辨率。值得注意的是,数据集中的样本不需要提前进行标记,因此可以较容易地获取足够多的样本。最后对数据集中的样本进行编号,方便网络调用数据。
[0075]
(3)从数据集中选择候选数据集。通常可以将所有的数据集作为选择候选数据集;
[0076]
(4)从候选数据集中选择子集。在第一次迭代中可以选择一个空集作为当前子集,在其他迭代中根据样本的不确定性从候选数据集中选择不确定性较小的一定比例样本作为当前子集,一般每次迭代可以取10%的候选样本作为子集;
[0077]
(5)从候选数据集中选择新的训练样本。每次迭代采用随机抽样的方式从候选数据集中选取少量的样本作为新的训练样本。在第一次迭代中可以选取50个样本,其他每次选取20个样本。对新的样本进行标记,添加到训练集中;
[0078]
(6)采用训练集更新裂缝识别的深度神经网络模型。本发明适用于目前主流的许多种深度神经网络模型,如u-net深度神经网络模型。在第一次迭代中需要搭建如图2所示的u-net深度神经网络模型,在其他迭代中只需要导入上一次迭代的模型进行再次训练。训练过程中的损失函数包括dice loss和交叉熵两个部分,其中dice loss定义为
[0079][0080]
式中,s
ip
和s
ig
分别为预测和真实的像素分类,n为像素总数。交叉熵损失函数的定义为
[0081][0082]
式中,x为输入也是深度神经网络模型的最后一层的输出,class为像素真实的标签索引值。定义好网络和损失函数后,采用小批量随机梯度下降方式训练深度神经网络模型;
[0083]
(7)判别深度神经网络模型收敛。采用上一次迭代中深度神经网络模型对数据集的预测标签作为真实标签再采用当前迭代的深度神经网络模型预测数据集的标签
然后根据真实标签、预测标签和网络的损失函数计算两次迭代中数据集的相对损失lossd。当连续n
data
=2次迭代中lossd小于容许值loss
dm
=0.15时,认为模型收敛条件满足,否则模型收敛条件没有满足;
[0084]
(8)当模型收敛条件没有满足时,需要重新进行下一次迭代计算。首先进行子集收敛判别。采用上一次迭代中深度神经网络模型对子集的预测标签作为真实标签再采用当前迭代的深度神经网络模型预测子集的标签然后根据真实标签、预测标签和网络的损失函数计算两次迭代中子集预测结果的相对损失losss。当连续n
sub
=1次迭代中losss小于容许值loss
sm
=0.3时,认为子集收敛条件满足,否则子集收敛条件没有满足;
[0085]
(9)若子集收敛条件满足,将子集从候选数据集中删除,从而缩小主动学习的搜索范围;
[0086]
(10)更新候选数据集样本的不确定性。采用深度神经网络模型预测候选数据集样本,基于预测结果的信息熵计算候选数据集样本的不确定性。基于信息熵的不确定性定义为
[0087][0088]
式中,p(si)为像素被预测为i类的概率,n为类别总数,n为样本图片的像素总数;
[0089]
(11)根据样本的不确定性,从候选数据集中选取不确定性最小的前ns个样本作为子集。其中ns为
[0090]ns
=p
snc (4)
[0091]
式中,ps为比例系数,可取0.1;nc为剩余的候选数据集样本数。
[0092]
(12)当模型收敛条件没有满足时,终止主动学习迭代过程,并保存训练好的深度神经网络模型。
[0093]
(13)采用训练好的深度神经网络模型进行高铁桥梁表观裂缝识别。
[0094]
图5和图6分别为原始表观裂缝图片和预测表观裂缝图片。由图可以看出,本发明具有较高的预测精度。图7为裂缝预测dice系数收敛过程,由图可以看出本发明的dice系数收敛较快,表明本发明具有较高的计算效率。
[0095]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0096]
若深度神经网络模型未满足收敛条件,采用上一次迭代中深度神经网络模型对当前子集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测当前子集的预测标签;根据真实标签、预测标签和网络的损失函数计算两次迭代中当前子集预测结果的相对损失,判断当前子集是否满足收敛条件;若当前子集未满足收敛条件,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新候选数据集的样本的不确定性。
[0097]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0098]
计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失,包括步骤:采用上一次迭代中深度神经网络模型对图片数据集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测图片数据集的预测标签,然后根据真实标签、预测标签和深度神经网络模型的损失函数计算两次迭代中数据集的相对损失。
[0099]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0100]
计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失,包括步骤:采用上一次迭代中深度神经网络模型对图片数据集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测图片数据集的预测标签,然后根据真实标签、预测标签和深度神经网络模型的损失函数计算两次迭代中数据集的相对损失。深度神经网络模型的损失函数包括dice loss损失函数和交叉熵损失函数两个部分;
[0101]
其中d i ce loss损失函数定义为:
[0102][0103]
式中,和分别为预测和真实的像素分类,n为像素总数;
[0104]
交叉熵损失函数的定义为:
[0105][0106]
x为输入也是深度神经网络模型的最后一层的输出,class为像素真实的标签索引值;
[0107]
深度神经网络模型的损失函数为:
[0108]
loss=loss
ce
+loss
dice

[0109]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,
对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0110]
若深度神经网络模型未满足收敛条件,采用上一次迭代中深度神经网络模型对当前子集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测当前子集的预测标签;根据真实标签、预测标签和网络的损失函数计算两次迭代中当前子集预测结果的相对损失,判断当前子集是否满足收敛条件;当连续若干次迭代中当前子集预测结果的相对损失小于第二容许值,当前子集满足收敛条件,将当前子集从候选数据集中删除,以缩小主动学习的搜索范围;采用深度神经网络模型预测候选数据集的样本,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新候选数据集的样本的不确定性。
[0111]
基于预测结果的信息熵计算候选数据集样本的不确定性,包括:
[0112]
基于信息熵的不确定性计算公式为:
[0113][0114]
p(si)为像素被预测为i类的概率,n为类别总数,n为样本图片的像素总数。
[0115]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0116]
若深度神经网络模型未满足收敛条件,采用上一次迭代中深度神经网络模型对当前子集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测当前子集的预测标签;根据真实标签、预测标签和网络的损失函数计算两次迭代中当前子集预测结果的相对损失,判断当前子集是否满足收敛条件;当连续若干次迭代中当前子集预测结果的相对损失小于第二容许值,当前子集满足收敛条件,将当前子集从候选数据集中删除,以缩小主动学习的搜索范围;采用深度神经网络模型预测候选数据集的样本,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新候选数据集的样本的不确定性。
[0117]
根据样本的不确定性,从候选数据集中选取不确定性最小的前ns个样本作为新的当前子集,其中ns定义为:
[0118]ns
=psnc[0119]
ps为比例系数,nc为剩余的候选数据集样本数。
[0120]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续
在两次迭代中图片数据集预测结果的相对损失小于第一容许值,第一容许值为0.15,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0121]
在一实施例中,基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法包括步骤:获取高铁桥梁表观裂缝图片数据集,从图片数据集中选择候选数据集,并从候选数据集中选择当前子集;采用随机抽样的方式从候选数据集中选取多个样本作为新的训练样本,对训练样本进行标记,添加到训练集中;使用训练集更新裂缝识别的深度神经网络模型,计算相邻两次迭代训练过程中深度神经网络模型对图片数据集预测结果的相对损失;若连续在多次迭代中图片数据集预测结果的相对损失小于第一容许值,深度神经网络模型收敛;保存深度神经网络模型,并使用深度神经网络模型进行高铁桥梁表观裂缝识别。
[0122]
若深度神经网络模型未满足收敛条件,采用上一次迭代中深度神经网络模型对当前子集的预测标签作为真实标签,采用当前迭代的深度神经网络模型预测当前子集的预测标签;根据真实标签、预测标签和网络的损失函数计算两次迭代中当前子集预测结果的相对损失,判断当前子集是否满足收敛条件;当连续一迭代中当前子集预测结果的相对损失小于第二容许值,第二容许值为0.3,当前子集满足收敛条件,将当前子集从候选数据集中删除,以缩小主动学习的搜索范围;采用深度神经网络模型预测候选数据集的样本,基于预测结果的信息熵计算候选数据集样本的不确定性,以更新候选数据集的样本的不确定性。
[0123]
本发明还提供了一种基于自适应子集搜索和深度学习的桥梁表观裂缝识别系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法。
[0124]
处理器和存储器可以通过总线或者其他方式连接。
[0125]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0126]
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0127]
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个处理器或控制器执行,例如,被上述终端实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的基于自适应子集搜索和深度学习的桥梁表观裂缝识别方法。
[0128]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领
域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置,或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0129]
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
[0130]
以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1