基于卷积神经网络的斗轮性能监测方法及其系统与流程

文档序号:33463791发布日期:2023-03-15 05:51阅读:29来源:国知局
基于卷积神经网络的斗轮性能监测方法及其系统与流程

1.本技术涉及性能监测技术领域,且更为具体地,涉及一种基于卷积神经网络的斗轮性能监测方法及其系统。


背景技术:

2.斗轮挖掘机是斗轮连续系统中重要的挖掘设备。由于斗轮挖掘机的斗轮在使用过程中直接与矿石、砂土、岩石等接触,因此,斗轮是斗轮挖掘机的关键易损件。在斗轮挖掘机的工作过程中,对斗轮性能监测尤为重要,其原因为如果斗轮性能无法满足应用要求而继续被使用的话,其会影响工作效率,其次,如果斗轮发生破损,还会造成意外和伤害。
3.因此,期待一种斗轮性能监测方案。


技术实现要素:

4.为了解决上述技术问题,提出了本技术。本技术的实施例提供了一种基于卷积神经网络的斗轮性能监测方法及其系统,其首先通过摄像头采集斗轮检测图像和斗轮参考图像,然后,使用卷积神经网络模型作为特征提取器将所述斗轮检测图像和所述斗轮参考图像映射到高维特征空间中,并计算两者在高维特征空间中的特征分布之间的差异以得到差分特征图,优选的,考虑到卷积神经网络模型选择性地使用特征的能力有限,因此,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图,并将所述增强差分特征图作为分类特征图通过分类器以得到用于表示待检测斗轮的性能是否满足预定要求的分类结果,通过这样的方式,准确地对斗轮性能进行监测,以防斗轮发生破损,造成意外和伤害。
5.根据本技术的一个方面,提供了一种基于卷积神经网络的斗轮性能监测方法,其包括:
6.获取由摄像头采集的斗轮检测图像和斗轮参考图像;
7.将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构;
8.计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图;
9.将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图;
10.将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
11.根据本技术的另一方面,提供了一种基于卷积神经网络的斗轮性能监测系统,其包括:
12.图像获取模块,用于获取由摄像头采集的斗轮检测图像和斗轮参考图像
13.孪生编码模块,用于将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构;
14.差分模块,用于计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图;
15.特征增强模块,用于将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图;以及
16.分类模块,用于将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
17.根据本技术的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于卷积神经网络的斗轮性能监测方法。
18.根据本技术的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于卷积神经网络的斗轮性能监测方法。
19.与现有技术相比,本技术提供的一种基于卷积神经网络的斗轮性能监测方法及其系统,其首先通过摄像头采集斗轮检测图像和斗轮参考图像,然后,使用卷积神经网络模型作为特征提取器将所述斗轮检测图像和所述斗轮参考图像映射到高维特征空间中,并计算两者在高维特征空间中的特征分布之间的差异以得到差分特征图,优选的,考虑到卷积神经网络模型选择性地使用特征的能力有限,因此,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图,并将所述增强差分特征图作为分类特征图通过分类器以得到用于表示待检测斗轮的性能是否满足预定要求的分类结果,通过这样的方式,准确地对斗轮性能进行监测,以防斗轮发生破损,造成意外和伤害。
附图说明
20.通过结合附图对本技术实施例进行更详细的描述,本技术的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本技术实施例的进一步理解,并且构成说明书的一部分,与本技术实施例一起用于解释本技术,并不构成对本技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
21.图1图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法及其系统的应用场景图。
22.图2图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法的流程图。
23.图3图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法的系统架构的示意图。
24.图4图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法中,所述将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图的流程图。
25.图5图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法中,将所述差分特征图通过所述残差双注意力机制模型的空间注意力模块以得到空间注意力图的流程图。
26.图6图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测系统的框图示意图。
27.图7图示了根据本技术实施例的电子设备的框图。
具体实施方式
28.下面,将参考附图详细地描述根据本技术的示例实施例。显然,所描述的实施例仅仅是本技术的一部分实施例,而不是本技术的全部实施例,应理解,本技术不受这里描述的示例实施例的限制。
29.场景概述
30.如上所述,在斗轮挖掘机的工作过程中,对斗轮性能监测尤为重要,其原因为如果斗轮性能无法满足应用要求而继续被使用的话,其会影响工作效率,其次,如果斗轮发生破损,还会造成意外和伤害。因此,期待一种斗轮性能监测方案。
31.传统的斗轮性能监测方案通过对斗轮进行力学特征静态或者动态测试来实现,不仅费时费力,还需要专业的设备和专门的场所,无法满足应用需求。相应地,在本技术的技术方案中,本技术的申请人考虑到斗轮性能的变化会在其外观层面得到表征,例如,其会因氧化而使得表面颜色和纹理发生改变;随着结构应力与碰撞,其表面还会产生裂缝与刮痕等。因此,基于上述观察,本技术的申请人尝试基于机器视觉来构建斗轮性能监测方案。
32.具体地,首先获取由摄像头采集的斗轮检测图像和斗轮参考图像。这里引入斗轮参考图像的目的是为了比较斗轮监测图像和斗轮参考图像之间的差异,并以此作为依据来判断待检测斗轮的性能是否满足预定要求。但是,在方案测试中,本技术的申请人发现在进行斗轮检测图像采集时,斗轮表面会带有诸多干扰,例如,斗轮表面可能存在泥渍,这些干扰对象的引入虽然会拉大斗轮检测图像和斗轮参考图像在图像源域端的差异,但这种差异的放大反而会带来性能检测的精准度的下降。也就是,在进行斗轮监测图像和斗轮参考图像之间的比较时,期待能够聚焦于能够体现斗轮性能的图像特征之间的比较,而非直接在图像源域端进行逐像素对比。
33.针对上述问题,在本技术的技术方案中,将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构。本领域普通技术人员应知晓,通过以适当的方式对深度神经网络模型进行训练可使得所述深度神经网络模型具有特定功能,相应地,在本技术的技术方案中,通过训练数据对所述第一图像编码器和所述第二图像编码器所使用的深度神经网络模型进行训练以使得所述第一图像编码器和所述第二图像编码器能够聚焦于提取能够反映斗轮性能的图像局部特征。
34.在得到所述斗轮检测特征图和所述斗轮参考特征图后,计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图,以此来表示两者在高维特征空间中的特征分布差异,即,用于表示斗轮性能的图像特征分布之间的特征分布差异。但是,网络经过一系列卷积之后,会得到部分特征信息,但不会自动区分高低频间的详细信息与各个类别特征间的差异性,网络选择性地使用特征的能力有限,鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变,因此在本技术的技术方案中,引入注意力机制对所述差分特征图进行特征增强。
35.并且,在引入注意机制的基础上,还通过引入残差结构,将其与双注意力网络相结合来构造残差双注意力模型,此模型将空间注意力和通道注意力并行组合,使得不同类型
的有效信息被大量捕捉到,可有效增强特征辨别学习能力,在网络训练过程中,任务处理系统更专注于找到输入数据中显著的与当前输出相关的有用信息,从而提高输出的质量,且渐增的注意力模块将带来持续的性能提升。
36.也就是,在本技术的技术方案中,在得到所述差分特征图后,进一步地,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图。并将所述增强差分特征图作为分类特征图通过分类器以得到用于表示待检测斗轮的性能是否满足预定要求的分类结果。
37.在所述残差双注意力机制中,首先将所述差分特征图分别通过空间注意力模块和通道注意力模块以得到空间注意力图和通道注意力图,并将两者进行融合以得到加权特征图。进而,利用残差级联思想,来融合所述加权特征图和输入特征图,即所述差分特征图以得到所述增强差分特征图。这里,通过特征图之间的点加来融合所述加权特征图f

和输入特征图,即所述差分特征图,例如记为f,由此,就期望所述加权特征图f

和所述差分特征图f的特征分布在高维特征空间内存在尽量小的空间位置误差,从而提高加权特征图f

和所述差分特征图f的融合效果。
38.在本技术的技术方案中,考虑到所述加权特征图f

是通过残差双注意力机制从所述差分特征图f得到的,因此所述加权特征图f

和所述差分特征图f本质上是同源的,从而在特征分布上存在一定的对应性,因此,可以对所述加权特征图f

和所述差分特征图f分别进行相对类角度概率信息表示校正,表示为:
[0039][0040][0041][0042]
其中和分别是所述差分特征图f和所述加权特征图f

的特征值,且和是所述差分特征图f和所述加权特征图f

的全部特征值的均值。
[0043]
这里,所述相对类角度概率信息表示校正通过所述差分特征图f和所述加权特征图f

之间的相对类角度概率信息表示,来进行所述差分特征图f和所述加权特征图f

在高维特征空间内的特征分布的空间位置误差的几何精度稀释,从而在所述差分特征图f和所述加权特征图f

间具有一定对应性的情况下,基于所述差分特征图f和所述加权特征图f

各自的各位置的特征值分布相较于彼此整体的分布约束性,来通过按位置的逐点回归来进行特征的隐式上下文对应性校正,从而提高所述差分特征图f和所述加权特征图f

的融合效果,也就相应提高了所述增强差分特征图的分类结果的准确性。也就是,提高对于斗轮性能监测的精准度。
[0044]
基于此,本技术提供了一种基于卷积神经网络的斗轮性能监测方法,其包括:获取由摄像头采集的斗轮检测图像和斗轮参考图像;将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构;计算所
述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图;将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图;将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
[0045]
图1图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法及其系统的应用场景图。如图1所示,在该应用场景中,通过摄像头(例如,图1中所示意的c)采集斗轮挖掘机(例如,图1中所示意的w)的斗轮(例如,图1中所示意的b)检测图像和斗轮参考图像,然后,将采集的所述斗轮检测图像和所述斗轮参考图像输入至部署有基于卷积神经网络的斗轮性能监测算法的服务器中(例如,图1中所示意的s),其中,所述服务器能够使用所述基于卷积神经网络的斗轮性能监测算法对所述斗轮检测图像和所述斗轮参考图像进行处理以生成斗轮性能监测结果。
[0046]
在介绍了本技术的基本原理之后,下面将参考附图来具体介绍本技术的各种非限制性实施例。
[0047]
示例性方法
[0048]
图2图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法的流程图。如图2所示,根据本技术实施例的所述基于卷积神经网络的斗轮性能监测方法,包括:s110,获取由摄像头采集的斗轮检测图像和斗轮参考图像;s120,将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构;s130,计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图;s140,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图;s150,将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
[0049]
图3图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法的系统架构的示意图。如图3所示,在本技术实施例的所述基于卷积神经网络的斗轮性能监测方法的系统架构中,首先,获取由摄像头采集的斗轮检测图像,并将所述斗轮检测图像通过孪生网络模型的第一图像编码器以得到斗轮检测特征图。同时,获取由摄像头采集的斗轮参考图像,并将所述斗轮参考图像通过所述孪生网络模型的第二图像编码器以得到斗轮参考特征图。然后,计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图,并将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图。最后,将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
[0050]
在本技术实施例的s110中,获取由摄像头采集的斗轮检测图像和斗轮参考图像。如上所述,传统的斗轮性能监测方案通过对斗轮进行力学特征静态或者动态测试来实现,不仅费时费力,还需要专业的设备和专门的场所,无法满足应用需求。相应地,在本技术的技术方案中,考虑到斗轮性能的变化会在其外观层面得到表征,例如,其会因氧化而使得表面颜色和纹理发生改变;随着结构应力与碰撞,其表面还会产生裂缝与刮痕等。也就是说,可以通过图像来进行性能检测,当然,考虑到人眼无法通过图像来对斗轮性能的改变进行准确的观察判断,因此,本技术尝试基于机器视觉来构建斗轮性能监测方案。
[0051]
具体地,首先获取由摄像头采集的斗轮检测图像和斗轮参考图像。这里引入斗轮
参考图像的目的是为了比较斗轮监测图像和斗轮参考图像之间的差异,并以此作为依据来判断待检测斗轮的性能是否满足预定要求。但是,在方案测试中,本技术的申请人发现在进行斗轮检测图像采集时,斗轮表面会带有诸多干扰,例如,斗轮表面可能存在泥渍,这些干扰对象的引入虽然会拉大斗轮检测图像和斗轮参考图像在图像源域端的差异,但这种差异的放大反而会带来性能检测的精准度的下降。也就是,在进行斗轮监测图像和斗轮参考图像之间的比较时,期待能够聚焦于能够体现斗轮性能的图像特征之间的比较,而非直接在图像源域端进行逐像素对比。
[0052]
在本技术实施例的s120中,将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构。应可以理解,考虑到斗轮表面可能存在泥渍影响斗轮检测的结果,因此,在本技术的技术方案中,通过图像编码器将所述斗轮检测图像和所述斗轮参考图像映射到高维特征空间。具体的,将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图。同时,考虑到所述斗轮检测图像和所述斗轮参考图像在源域端的数据量和数据分布都相同,因此所述第一图像编码器和第二图像编码器使用相同的网络结构,进而使通过所述第一图像编码器和第二图像编码器获得的特征图维度和大小统一,便于后续的在高维特征空间中的特征分布差异计算。
[0053]
在本技术一个具体的实施例中,所述第一图像编码器和所述第二图像编码器为深度卷积神经网络模型。应可以理解,考虑到深度卷积神经网络模型在图像特征提取领域具有优异性能表现,其能够提取到图像的本质特征,因此,在本实施例中,进一步地使用卷积神经网络模型作为特征提取器将所述斗轮检测图像和所述斗轮参考图像映射到高维特征空间。优选地,本领域普通技术人员应知晓,还可以通过适当的方式对深度神经网络模型进行训练可使得所述深度神经网络模型具有特定功能,相应地,在本技术的技术方案中,通过训练数据对所述第一图像编码器和所述第二图像编码器所使用的深度神经网络模型进行训练以使得所述第一图像编码器和所述第二图像编码器能够聚焦于提取能够反映斗轮性能的图像局部特征。
[0054]
在本技术一个具体的实施例中,所述将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,包括:使用所述第一图像编码器的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以由所述第一图像编码器的最后一层输出所述斗轮检测特征图;以及,使用所述第二图像编码器的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以由所述第二图像编码器的最后一层输出所述斗轮参考特征图。
[0055]
更具体地,在该实施例中,在所述第一图像编码器的各层在层的正向传递中分别对输入图像进行如下处理,使用二维卷积核在输入图像上滑动,并且在每个位置上进行值的计算,以提取所述输入图像的高维局部隐含特征以得到所述卷积特征图;再通过对所述卷积特征图基于局部特征矩阵的平均值池化处理或者最大值池化处理以获得所述池化特征图,通过全局池化处理,可以提取主要特征,同时减小参数的数量并减小过拟合。然后,选择激活函数对所述池化特征图行激活以得到激活特征图,例如sigmoid激活函数,通过激活
函数引入非线性因素,以增加整个网络的表征能力。
[0056]
在本技术实施例的s130中,计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图。应可以理解,考虑到如果直接将所述斗轮检测特征图输入分类器会由于缺乏与斗轮参考特征图之间的对比而导致检测结果的准确性下降,因此,在得到所述斗轮检测特征图和所述斗轮参考特征图后,计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图,以此来表示两者在高维特征空间中的特征分布差异,即,用于表示斗轮性能的图像特征分布之间的特征分布差异。
[0057]
在本技术一个具体的实施例中,所述计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图,包括:以如下公式计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图;
[0058]
其中,所述公式为:
[0059][0060]
其中,fa表示所述斗轮检测特征图,表示按位置作差,fb表示所述斗轮参考特征图,且fc表示所述差分特征图。
[0061]
在本技术实施例的s140中,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图。应可以理解,考虑到网络经过一系列卷积之后,会得到部分特征信息,但不会自动区分高低频间的详细信息与各个类别特征间的差异性,网络选择性地使用特征的能力有限,鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变,因此在本技术的技术方案中,引入注意力机制对所述差分特征图进行特征增强。
[0062]
并且,在引入注意机制的基础上,还通过引入残差结构,将其与双注意力网络相结合来构造残差双注意力模型,此模型将空间注意力和通道注意力并行组合,使得不同类型的有效信息被大量捕捉到,可有效增强特征辨别学习能力,在网络训练过程中,任务处理系统更专注于找到输入数据中显著的与当前输出相关的有用信息,从而提高输出的质量,且渐增的注意力模块将带来持续的性能提升。也就是,在本技术的技术方案中,在得到所述差分特征图后,进一步地,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图。
[0063]
图4图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法中,所述将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图的流程图。如图4所示,在本技术一个具体的实施例中,所述将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图,包括:s210,将所述差分特征图通过所述残差双注意力机制模型的空间注意力模块以得到空间注意力图;s220,将所述差分特征图通过所述残差双注意力机制模型的通道注意力模块以得到通道注意力图;s230,融合所述空间注意力图和所述通道注意力图以得到加权特征图;以及,s240,融合所述差分特征图和所述加权特征图以得到所述增强差分特征图。
[0064]
图5图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测方法中,将所述差分特征图通过所述残差双注意力机制模型的空间注意力模块以得到空间注意力图的流程图。如图5所示,在本技术一个具体的实施例中,所述将所述差分特征图通过所述残差双注意力机制模型的空间注意力模块以得到空间注意力图,包括:s310,对所述差分特征图
分别进行沿通道维度的平均池化和最大值池化以得到平均特征矩阵和最大值特征矩阵;s320,将所述平均特征矩阵和所述最大值特征矩阵进行级联和通道调整以得到通道特征矩阵;s330,使用所述空间注意力模块的卷积层对所述通道特征矩阵进行卷积编码以得到卷积特征矩阵;s340,将所述卷积特征矩阵通过softmax函数以得到空间注意力得分矩阵;以及,s350,将所述空间注意力得分矩阵与所述差分特征图沿通道维度的各个特征矩阵进行按位置点乘以得到所述空间注意力图。
[0065]
在本技术一个具体的实施例中,所述将所述差分特征图通过所述残差双注意力机制模型的通道注意力模块以得到通道注意力图,包括:对所述差分特征图的沿通道维度的各个特征矩阵进行全局均值池化以得到通道特征向量;将所述通道特征向量通过softmax函数以得到归一化通道特征向量;以所述归一化通道特征向量中各个位置的特征值作为权重对所述差分特征图的沿通道维度的特征矩阵进行加权以得到通道注意力图。
[0066]
特别地,在本技术技术方案中,在所述残差双注意力机制中,首先将所述差分特征图分别通过空间注意力模块和通道注意力模块以得到空间注意力图和通道注意力图,并将两者进行融合以得到加权特征图。进而,利用残差级联思想,来融合所述加权特征图和输入特征图,即所述差分特征图以得到所述增强差分特征图。这里,通过特征图之间的点加来融合所述加权特征图f

和输入特征图,即所述差分特征图,例如记为f,由此,就期望所述加权特征图f

和所述差分特征图f的特征分布在高维特征空间内存在尽量小的空间位置误差,从而提高加权特征图f

和所述差分特征图f的融合效果。在本技术的技术方案中,考虑到所述加权特征图f

是通过残差双注意力机制从所述差分特征图f得到的,因此所述加权特征图f

和所述差分特征图f本质上是同源的,从而在特征分布上存在一定的对应性,因此,可以对所述加权特征图f

和所述差分特征图f分别进行相对类角度概率信息表示校正。
[0067]
在本技术一个具体的实施例中,融合所述空间注意力图和所述通道注意力图以得到加权特征图,包括:计算所述空间注意力图和所述通道注意力图之间的按位置点加以得到所述加权特征图。
[0068]
在本技术一个具体的实施例中,所述融合所述差分特征图和所述加权特征图以得到所述增强差分特征图,包括:基于所述加权特征图,以如下公式对所述差分特征图进行相对类角度概率信息表示校正以得到校正后差分特征图;
[0069]
其中,所述公式为:
[0070][0071]
其中和分别是所述差分特征图f和所述加权特征图f

的特征值,且和是所述差分特征图f和所述加权特征图f

的全部特征值的均值,l og表示以2为底的对数函数值;基于所述差分特征图,以如下公式对所述加权特征图进行相对类角度概率信息表示校正以得到校正后加权特征图;
[0072]
其中,所述公式为:
[0073]
[0074]
其中和是所述差分特征图f和所述加权特征图f

的特征值,且和是所述差分特征图f和所述加权特征图f

的全部特征值的均值,l og表示以2为底的对数函数值;以及,计算所述校正后差分特征图和所述校正后加权特征图之间的按位置点加以得到所述增强差分特征图。
[0075]
这里,所述相对类角度概率信息表示校正通过所述差分特征图f和所述加权特征图f

之间的相对类角度概率信息表示,来进行所述差分特征图f和所述加权特征图f

在高维特征空间内的特征分布的空间位置误差的几何精度稀释,从而在所述差分特征图f和所述加权特征图f

间具有一定对应性的情况下,基于所述差分特征图f和所述加权特征图f

各自的各位置的特征值分布相较于彼此整体的分布约束性,来通过按位置的逐点回归来进行特征的隐式上下文对应性校正,从而提高所述差分特征图f和所述加权特征图f

的融合效果,也就相应提高了所述增强差分特征图的分类结果的准确性。也就是,提高对于斗轮性能监测的精准度。
[0076]
在本技术实施例的s150中,将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
[0077]
在本技术一个具体的实施例中,所述将所述增强差分特征图通过分类器以得到分类结果,包括:使用所述分类器以如下公式对所述增强差分特征图进行处理以获得所述分类结果;其中,所述公式为:o=softmax{(wc,bc)|project(f)},其中project(f)表示将所述增强差分特征图投影为向量,wc为权重矩阵,bc表示偏置向量。
[0078]
也就是,将通过将所述增强差分特征图投影为一维的分类特征向量,然后,再使用所述分类器的全连接层对所述分类特征向量进行全连接编码以充分利用所述差分特征图中各个位置的信息从而得到编码分类特征向量。然后,计算所述编码分类特征向量的softmax函数值,即,所述编码分类特征向量归属于各个分类标签的概率值,在本技术实施例中,所述分类标签包括待检测斗轮的性能满足预定要求(第一标签)以及待检测斗轮的性能不满足预定要求(第二标签)。最后,将概率值较大者对应的标签作为所述分类结果。
[0079]
综上,本技术实施例的基于卷积神经网络的斗轮性能监测方法已被阐明,其首先通过摄像头采集斗轮检测图像和斗轮参考图像,然后,使用卷积神经网络模型作为特征提取器将所述斗轮检测图像和所述斗轮参考图像映射到高维特征空间中,并计算两者在高维特征空间中的特征分布之间的差异以得到差分特征图,优选的,考虑到卷积神经网络模型选择性地使用特征的能力有限,因此,将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图,并将所述增强差分特征图作为分类特征图通过分类器以得到用于表示待检测斗轮的性能是否满足预定要求的分类结果,通过这样的方式,准确地对斗轮性能进行监测,以防斗轮发生破损,造成意外和伤害。
[0080]
示例性系统
[0081]
图6图示了根据本技术实施例的基于卷积神经网络的斗轮性能监测系统的框图示意图。如图6所示,根据本技术实施例的所述基于卷积神经网络的斗轮性能监测系统100,包括:图像获取模块110,用于获取由摄像头采集的斗轮检测图像和斗轮参考图像;孪生编码模块120,用于将所述斗轮检测图像和所述斗轮参考图像通过包含第一图像编码器和第二图像编码器的孪生网络模型以得到斗轮检测特征图和斗轮参考特征图,其中,所述第一图像编码器和第二图像编码器具有相同的网络结构;差分模块130,用于计算所述斗轮检测特
征图和所述斗轮参考特征图之间的差分特征图;特征增强模块140,用于将所述差分特征图通过残差双注意力机制模型以得到增强差分特征图;以及,分类模块150,用于将所述增强差分特征图通过分类器以得到分类结果,所述分类结果用于表示待检测斗轮的性能是否满足预定要求。
[0082]
在本技术一个具体的实施例中,所述第一图像编码器和所述第二图像编码器为深度卷积神经网络模型。
[0083]
在本技术一个具体的实施例中,所述孪生编码模块,包括:第一编码单元,用于使用所述第一图像编码器的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以由所述第一图像编码器的最后一层输出所述斗轮检测特征图;以及,第二编码单元,用于使用所述第二图像编码器的各层在层的正向传递中分别对输入数据进行卷积处理、池化处理和非线性激活处理以由所述第二图像编码器的最后一层输出所述斗轮参考特征图。
[0084]
在本技术一个具体的实施例中,所述差分模块,包括:以如下公式计算所述斗轮检测特征图和所述斗轮参考特征图之间的差分特征图;
[0085]
其中,所述公式为:
[0086][0087]
其中,fa表示所述斗轮检测特征图,表示按位置作差,fb表示所述斗轮参考特征图,且fc表示所述差分特征图。
[0088]
在本技术一个具体的实施例中,所述特征增强模块,包括:空间注意力编码单元,用于将所述差分特征图通过所述残差双注意力机制模型的空间注意力模块以得到空间注意力图;通道注意力编码单元,用于将所述差分特征图通过所述残差双注意力机制模型的通道注意力模块以得到通道注意力图;加权单元,用于融合所述空间注意力图和所述通道注意力图以得到加权特征图;以及,融合单元,用于融合所述差分特征图和所述加权特征图以得到所述增强差分特征图。
[0089]
在本技术一个具体的实施例中,所述空间注意力编码单元,包括:池化子单元,用于对所述差分特征图分别进行沿通道维度的平均池化和最大值池化以得到平均特征矩阵和最大值特征矩阵;聚合子单元,用于将所述平均特征矩阵和所述最大值特征矩阵进行级联和通道调整以得到通道特征矩阵;卷积子单元,用于使用所述空间注意力模块的卷积层对所述通道特征矩阵进行卷积编码以得到卷积特征矩阵;激活子单元,用于将所述卷积特征矩阵通过softmax函数以得到空间注意力得分矩阵;以及,空间注意力施加子单元,用于将所述空间注意力得分矩阵与所述差分特征图沿通道维度的各个特征矩阵进行按位置点乘以得到所述空间注意力图。
[0090]
在本技术一个具体的实施例中,所述通道注意力编码单元,包括:全局池化子单元,用于对所述差分特征图的沿通道维度的各个特征矩阵进行全局均值池化以得到通道特征向量;归一化子单元,用于将所述通道特征向量通过softmax函数以得到归一化通道特征向量;通道注意力施加子单元,用于以所述归一化通道特征向量中各个位置的特征值作为权重对所述差分特征图的沿通道维度的特征矩阵进行加权以得到通道注意力图。
[0091]
在本技术一个具体的实施例中,所述加权单元,包括:计算所述空间注意力图和所述通道注意力图之间的按位置点加以得到所述加权特征图。
[0092]
在本技术一个具体的实施例中,所述融合单元,包括:第一校正子单元,用于基于所述加权特征图,以如下公式对所述差分特征图进行相对类角度概率信息表示校正以得到校正后差分特征图;
[0093]
其中,所述公式为:
[0094][0095]
其中和分别是所述差分特征图f和所述加权特征图f

的特征值,且和是所述差分特征图f和所述加权特征图f

的全部特征值的均值,l og表示以2为底的对数函数值;第二校正子单元,用于基于所述差分特征图,以如下公式对所述加权特征图进行相对类角度概率信息表示校正以得到校正后加权特征图;
[0096]
其中,所述公式为:
[0097][0098]
其中和是所述差分特征图f和所述加权特征图f

的特征值,且和是所述差分特征图f和所述加权特征图f

的全部特征值的均值,l og表示以2为底的对数函数值;以及,点加子单元,用于计算所述校正后差分特征图和所述校正后加权特征图之间的按位置点加以得到所述增强差分特征图。
[0099]
在本技术一个具体的实施例中,所述分类模块,包括:使用所述分类器以如下公式对所述增强差分特征图进行处理以获得所述分类结果;其中,所述公式为:o=softmax{(wc,bc)|project(f)},其中project(f)表示将所述增强差分特征图投影为向量,wc为权重矩阵,bc表示偏置向量。
[0100]
这里,本领域技术人员可以理解,上述基于卷积神经网络的斗轮性能监测系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图5的基于卷积神经网络的斗轮性能监测方法的描述中得到了详细介绍,并因此,将省略其重复描述。
[0101]
如上所述,根据本技术实施例的所述基于卷积神经网络的斗轮性能监测系统100可以实现在各种终端设备中,例如部署有基于卷积神经网络的斗轮性能监测算法的服务器等。在一个示例中,所述基于卷积神经网络的斗轮性能监测系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于卷积神经网络的斗轮性能监测系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于卷积神经网络的斗轮性能监测系统100同样可以是该终端设备的众多硬件模块之一。
[0102]
替换地,在另一示例中,该基于卷积神经网络的斗轮性能监测系统100与该终端设备也可以是分立的设备,并且基于卷积神经网络的斗轮性能监测系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
[0103]
示例性电子设备
[0104]
下面,参考图7来描述根据本技术实施例的电子设备。
[0105]
图7图示了根据本技术实施例的电子设备的框图。
[0106]
如图7所示,电子设备10包括一个或多个处理器11和存储器12。
[0107]
处理器11可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
[0108]
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本技术的各个实施例的斗轮性能监测以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如摄像头采集的斗轮检测图像和斗轮参考图像等各种内容。
[0109]
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
[0110]
该输入装置13可以包括例如键盘、鼠标等等。
[0111]
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
[0112]
示例性计算机程序产品和计算机可读存储介质
[0113]
除了上述方法和设备以外,本技术的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的基于卷积神经网络的斗轮性能监测方法的步骤。
[0114]
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本技术实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
[0115]
此外,本技术的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的基于卷积神经网络的斗轮性能监测方法的步骤。
[0116]
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0117]
以上结合具体实施例描述了本技术的基本原理,但是,需要指出的是,在本技术中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本技术的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作
用,而非限制,上述细节并不限制本技术为必须采用上述具体的细节来实现。
[0118]
本技术中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
[0119]
还需要指出的是,在本技术的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本技术的等效方案。
[0120]
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本技术。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本技术的范围。因此,本技术不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0121]
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本技术的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1