一种轻量级鸟类分类模型的设计方法和系统

文档序号:35864916发布日期:2023-10-26 22:26阅读:41来源:国知局

本发明涉及鸟类识别和深度学习领域,特别是涉及一种轻量级鸟类分类模型的设计方法和系统。


背景技术:

1、几乎所有环境中都存在鸟类,鸟类的多样性是评估当地自然环境质量的重要环节。然而,世界各地鸟类物种和种群正在不同程度地减少,甚至面临灭绝。通过监测鸟类的种群和数量,研究人员可以及时发现鸟类物种和种群的变化,从而制定相应的保护策略。

2、在大多数情况下,监测人员选择鸟叫声作为主要的鸟类监测方法,但此方法在安静的山林环境中往往高效,而在城市等噪音大的环境中就不如图像检测更为有效。此外,鸟类是目前为止被拍摄最多的动物之一,不同的图片包含鸟类的各种姿态、颜色和形状,这也在不同程度上促进了鸟类物种识别的研究。与此同时,研究人员倾向于使用物联网设备对鸟类种群进行远程在线监测。然而,由于大多数鸟类的栖息地都在野外,即使在良好的网络条件下,在线监测系统也很难将拍摄的鸟类图片传回服务器进行数据处理、识别和反馈,如果在鸟类保护区进行离线监测,低成本的嵌入式设备更无法支持高难度的图像识别算法。为了解决这一系列问题,本发明提出了一种轻量级鸟类分类模型的设计方法和系统,该设计方法可以使用单一特征实现高精确度,而且模型轻量化可以在低成本的嵌入式设备上运行。

3、目前关于鸟类智能识别问题已经有了众多研究,包括图像、声音、视频识别等等。有学者提出了有显著性的图形模型gms,通过将图像过度分割成若干区域,gms可用于提取图像,并根据每个区域的局部上下部分和全局上下部分及显著性对图像进行分类。同时,为了提高准确性,使用svm根据注释鸟类的特征对图像进行分类。有的学者采用基于纠错输出编码ecoc和支持向量机svm的融合分类方法对鸟类进行分类,并提取鸟类声音的mel频率倒谱系数mfcc作为声学特征。ecoc-svm与随机森林rf、高斯混合模型gmm和多层感知器神经网络mlp-nn以及卷积神经网络cnn进行了比较,用于鸟类声音分类。有学者提出了一种新的基于超球的weight imprinting方法,能够以正则化、印记感知的方式训练神经网络,有效克服了weight imprinting不能处理具有多模态分布的新类的问题。也有学者进一步改进了squeezenet,在squeezenet中以不同的方式嵌入了两个不同的注意力机制,然后用双线性融合的方式融合注意力特征图,再将新的注意力特征图与网络的最后一层融合,得到一个新的张量,最后送入线性层进行分类,获得了良好的效果。有的学者提出了一类注意力转移cnns,将部分注意力知识从一个非常大的细粒度视觉分类fgvc网络转移到一个小而有效的网络中,大大改善了其表现力。

4、虽然目前的研究已较广泛并且解决了一些存在的实际问题,但仍存在诸多不足。例如大多数模型在类别和图片方面使用的数据集数量较少,导致训练有素的模型泛化能力差。此外,大多数模型参数数量非常大,计算复杂度也相对较高,无法部署在低成本的嵌入式设备中,因此在偏远地区的应用更加困难。虽然一些模型能够满足低功耗和低计算量的要求,但它们并没有针对鸟类分类进行专业的训练和改进,所以这些模型在鸟类分类中的准确性往往有些不尽人意。因此,设计一个泛化能力强、计算量小、识别精度高的鸟类分类识别模型十分必要。


技术实现思路

1、本发明为克服现有鸟类分类模型泛化能力弱、计算量大、识别精度低等问题,提供了一种轻量级鸟类分类模型的设计方法和系统。

2、本发明的技术方案具体如下:

3、一种轻量级鸟类分类模型的设计方法和系统应包括以下几个步骤:

4、s1:收集各类鸟类的图片,并对这些图片进行预处理,进一步转化为模型的训练数据;

5、s2:采用一个多通道特征融合模块处理上述s1中图片的不同特征信息;

6、s3:引入squeeze-and-excitation模块,以提高模型对图像信道信息的感知能力;

7、s4:引入coordinate attention模块来考虑图像的信道和空间特性,以进一步提高模型的准确性;

8、s5:对s2-s4进行迭代训练,生成轻量级鸟类分类模型;

9、s6:将上述s5训练生成的轻量级鸟类分类模型部署到嵌入式智能设备中,实现对自然环境中鸟类的监测与识别。

10、进一步改进在于,步骤s1-s5为数据集的建立和模型的建立与训练过程,步骤s6为面向自然环境的鸟类分类识别系统的具体工作方式。

11、进一步改进在于,步骤s2采用一个多通道特征融合模块处理上述s1中图片的不同特征信息,具体包括以下几个步骤:

12、s2.1:采用具有三个分支的inception结构来充分提取图片原始数据的不同特征,第一个分支采用一个1×1卷积,第二个分支采用一个3×3卷积,第三个分支采用一个1×1卷积和一个3×3卷积;

13、s2.2:将多尺度通道注意力模块ms_cam结构分别添加到三个分支中后,使网络能够识别和检测极端尺度变化下的目标;

14、进一步改进在于,步骤s2.2中将多尺度通道注意力模块ms_cam结构分别添加到三个分支中后,使网络能够识别和检测极端尺度变化下的目标,其中的ms_cam机构既可以强调具有更多全局分布的大物体,也强调具有更多局部分布的小细节,使网络在极端尺度变化下完成对目标的识别。

15、进一步改进在于,步骤s3引入了squeeze-and-excitation模块,以提高模型对图像信道信息的感知能力,具体包括以下几个步骤:

16、s3.1:通过全局平均池化,将每个通道的二维特征压缩为一个实数,得到通道级别的全局特征;

17、s3.2:为每个特征通道生成一个权重值,通过两个全连接层构建通道之间的相关性;

18、s3.3:将归一化权重对每个通道的特征进行加权,完成对注意力迁移所需的特征;

19、进一步改进在于,步骤s4中引入coordinate attention模块来考虑图像的信道和空间特性,以进一步提高模型的准确性,具体步骤为:将高宽利用图像大小为(h,1)和(1w)的池核沿横坐标方向对每个通道进行编码,得到高、宽两个方向的特征映射,即在一个空间方向上捕捉到长距离的相关性,而在另一个空间方向上保留准确的位置信息,特征图被编码为一对方向和位置敏感的注意图,对输入特征图进行了补充,增强了模型对全局特征的提炼能力。

20、进一步改进在于,该轻量级鸟类分系统包括相机、nvidia jetson tx2模组、无线通信模块、服务器,其中:相机、nvidia jetson tx2模组、通信模块集成在嵌入式智能设备中,将嵌入式智能设备安装于自然环境中实现对鸟类的实时监测,并将监测得到的数据通过嵌入式智能设备中的无线通讯模块传送到服务器中,供相关人员分析、处理。

21、本发明提出的一种新的鸟类声音识别方法和系统,采用以上技术方案与现有技术相比,具有以下技术效果:

22、本发明构建了一个包含275种鸟类的数据集,可用于提高模型的泛化能力。

23、本发明提出了一种可以集成到嵌入式设备的卷积神经网络,通过增加多通道特征融合模块和squeeze-and-excitation模块以及协调注意力,在模型参数数量基本不变的情况下,保证了模型识别的准确性。

24、本发明设计了一个全新的特征融合模块,通过对多通道信息的捕捉,可以很好地提取图像的特征,加强模型对细节的捕捉能力,提高模型的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1