一种基于注意力和解耦合知识蒸馏的无患子病害分类方法

文档序号:37268423发布日期:2024-03-12 20:54阅读:25来源:国知局
一种基于注意力和解耦合知识蒸馏的无患子病害分类方法

本发明涉及计算机视觉,尤其涉及知识蒸馏和无患子病害图像分类技术,具体涉及一种基于注意力和解耦合知识蒸馏的无患子病害分类方法。


背景技术:

1、无患子为无患子科无患子属,是优良的能源树种与乡土园林树种。由于其树体高大、树干优美、治污力强,常将其作城市行道、公园绿化、庭院遮阴等,是南方优良的绿化先锋树种,同时,无患子是一种新型的低碳、环保可再生能源植物,具有广泛的综合利用价值,果肉中含有约28%的皂素,可制成优良的天然洗涤剂;种仁含油率高达40%,是一种新型的制备生物柴油原料。随着国家对生物质能源的重视,无患子树种的栽培面积迅速扩大,并且多数为人工纯林。但近年来由于病虫害不断侵蚀,给种植户带来了巨大的损失。由于一般林农缺少相关病虫害的专业知识,无法做到对无患子树种的病虫害做到准确辨别,因此仅依靠林农很难做到及时发现病虫害并做到精准防治,极大的影响经济效益,目前我国对无患子树种的病害分类识别工作大多数需要经由从事该方面的专家前往野外现场观察与识别,由于病害的发生呈季节性、人工纯林种植面积大,依靠专家对病害进行识别存在着费时、费力、主观性强等问题。因此结合日趋成熟的人工智能技术,基于深度学习搭建在野外能进行快速识别的无患子病害的移动端应用平台可以帮助种植无患子的农户及时了解病害种类并做出对应的防治措施,从而就能够做到及时诊断,有效防治,及时止损,提高种植户的收入,同时促进经济的绿色发展。

2、尽管深度学习技术在病害识别方面取得了显著进展,但仍然存在一些挑战。其中之一是深度学习模型通常需要大量的标记数据进行训练,植物的病虫害识别的研究对象主要集中在水稻、小麦、苹果等农作物,但针对无患子领域,国内外并没有已有的成规模的无患子病害数据集。此外在户外移动端设备上进行无患子病害类型识别,尤其是在农田等实际环境中,需要使用轻量级模型才具有实际意义,如何在保证精读的同时对模型进行轻量化也是需要解决的问题。

3、基于注意力和知识蒸馏的方法旨在克服上述挑战。通过引入注意力机制,模型可以集中注意力在图像中的关键区域,提高了在复杂环境下的识别性能。知识蒸馏允许将来自大型教师模型的知识传输给较小的模型,从而在数据稀缺的情况下提高模型的性能。同时知识蒸馏压缩后的模型可以在有限的计算资源下实现高效的、实时的识别,为现场工作者提供有力的支持。

4、知识蒸馏最早提出是通过最小化教师和学生logit之间的差异来传递知识,是一种新兴的压缩模型的方法。但目前的知识蒸馏直接使用kl散度函数计算教师和学生logit之间的差异大小,由于kl散度函数高度耦合,抑制了非目标类之间的差异对总差异值的贡献,极大的限制了知识蒸馏效果。

5、综上,开发高准确率的轻量级无患子病害分类模型,实现自动化病害监测,具有重要的研究价值。


技术实现思路

1、本发明为克服以上技术的不足,提供了一种基于注意力和知识蒸馏的无患子病害分类的方法。首先采用一种基于空间和通道注意力机制的方法,利用注意力机制增强不同通道的特征表示,同时提取空间中不同位置的关键信息,以此来提高模型的感知能力,从而在不增加网络复杂性的情况下改善模型性能;基于解耦合的知识蒸馏技术,实现了无患子病害分类模型的高效压缩,训练出既能满足预测精度也能嵌入移动端使用的学生模型。为了达到上述技术目的,本发明采用的技术方案为:

2、一种基于注意力和知识蒸馏的无患子病害分类方法,包括:

3、步骤1无患子种植基地实地拍摄获取无患子病害数据集;

4、步骤2将步骤1中获取的数据集输入教师模型,使用改进的resnet101深度卷积网络作为特征提取器,添加空间通道注意力机制和全局注意力机制,增强输入图像的不同通道的特征表示,同时提取空间中不同位置的关键信息。输入教师模型并将损失值最小的教师模型作为训练好的教师模型;

5、步骤3将步骤1中获得的数据集和步骤2教师模型输出的目标图像和局部区域图像输入学生模型,所述学生模型采用轻量级的卷积网络mobilenetv3作为特征提取器,基于解耦知识蒸馏,实现无患子病害分类模型的压缩;

6、步骤4预测阶段将目标图像输入最终的轻量级分类模型,获得最无患子病害分类类结果。

7、进一步的,步骤2中的resnet101改进包括如下步骤:

8、步骤2.1.1,将标准resnet中使用的瓶颈结构(大维度-小维度-大维度)改进为类似transform中的逆瓶颈结构(小维度-大维度-小维度)形式,这样能让信息在不同维度特征空间之间转换时避免压缩维度带来的信息损失。

9、步骤2.1.2,将瓶颈层中的3x3卷积替换成dwconv,达到分组卷积的效果,用于降低计算量。

10、步骤2.1.3,为提高步骤2.1.2因降低计算量而损失的精读,将网络的宽度(通道数)从64增加到96,以增强模型表示能力,提高模型的泛化能力。同时为了更好的适配网络宽度的修改,将传统残差网络的扩展因子从4增加到6,进一步增强其表示能力。

11、进一步的,步骤2中添加的空间和通道注意力的方法具体如下:

12、步骤2.2.1,在改进的resnet101中加入通道空间注意力机制。首先将特征图经过通道注意力模块,其中通道注意力的计算公式为:

13、

14、上式中输入为中间特征图f∈rc×h×w,经过通道注意力得到映射mc∈rc×1×1。

15、步骤2.2.2,根据步骤2.1.1中得到的原图注意力图mc再经过空间注意力模块,其中空间注意力模块的计算公式为:

16、

17、最终将特征图的映射ms(f)输出。

18、步骤2.2.3,加入全局注意力机制,将特征图输入进入全局注意力机制模块。其中全局注意力机制模块的计算公式如下:

19、

20、其中是该注意力池的权重。

21、步骤3中采用解耦合知识蒸馏方法,获取教师模型输出的无患子病害属于某一类别的概率,具体包括:

22、步骤3.1引入超参数温度t之后通过softmax计算第i个类别的概率pi,softmax计算公式如下:

23、

24、t是超参数温度,模型输出记为z=[z1,z2,...,zt,...,zc]∈r1×c,其中zi是第i类输出值,c是任务分类个数,pi表示第i个类别预测概率,记模型输出为p=[p1,p2,...,pt,...,pc]∈r1×c;

25、步骤3.2使用softmax公式计算目标类(pt)和所有其他非目标类(p\t)的预测概率,公式如下:

26、

27、

28、记b=[pt,p\t]∈r1×2表示模型目标类和非目标类预测概率;目标类知识蒸馏tckd的定义为:

29、tckd=kl(bt‖bs)

30、其中,s和t分别代表教师和学生;记为第i个非

31、目标类预测概率,公式入下:

32、

33、nckd的定义为:

34、

35、步骤3.3对kl损失函数进行拆解,首先把目标类分类概率从叠加运算中抽离出来:

36、

37、知识蒸馏损失可写为:

38、

39、根据上式可知,nckd的权重与相耦合,限制了非目标类知识传递。为改善上述情况,本方法给nckd赋予一个新的权重,定义为解耦合知识蒸馏(dkd),dkd的损失函数定义如下:

40、dkd=tckd+αnckd

41、dkd通过优化非目标类知识蒸馏权重,消除目标类预测概率对非目标类知识传递的抑制。

42、本发明所述的一种基于注意力机制和解耦合知识蒸馏的无患子病害识别分类方法,其显著优点是:提出添加注意力机制进行改进传统模型的方法,通过两种注意力机制来增加网络的表征力,关注特征图的重要特征,抑制不必要特征,以提高对无患子病害分类模型的识别准确率;采用改进的复杂模型resnet101作为教师模型,采用轻量级网络mobilenetv3作为学生模型的特征提取器;基于解耦合的知识蒸馏方法,优化了非目标类知识蒸馏权重,消除目标类预测概率对非目标类知识传递的抑制,显著提升了知识蒸馏效果,实现了无患子病害识别分类模型的高效压缩,在满足精度的前提下训练出参数量和计算量更小的学生模型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1