一种基于多特征融合迁移学习的鸟类个体识别方法与流程

文档序号:14748616发布日期:2018-06-22 09:01阅读:660来源:国知局

本发明涉及鸟类识别技术领域,特别是涉及一种基于多特征融合迁移学习的鸟类个体识别方法。



背景技术:

人类的活动和大自然的变化对鸟类生活环境有直接或间接的影响,从而可能对鸟类多样性构成威胁。鸟类数量是研究群落种群动态不可缺少的生态学变量,选用其作为生境适宜性定量评价,可以为制定合理的湿地保护和管理规划提供基础。因而鸟类识别对于鸟类和鸟类生活环境的保护有重要意义。

比如,东方大苇莺偏好在长势良好的芦苇丛中营巢,它在繁殖期内对巢域环境的要求尤为严格,对外界环境的变化非常敏感,因而是指示野鸭湖湿地环境变化的理想指示物种。东方大苇莺的调查通常采用人工调查方法,很大程度上依赖于观察者的视觉和听力能力,茂密的植被会造成观察者对远处鸟类的识别和计数困难,从而导致调查范围减小,而且结果具有一定的不确定性。同时湿地相对泥泞,徒步行走困难,且大多数情况下无法借助交通工具,需要花费大量的时间和精力。近年来,红外相机技术在国内野生动物调查与监测中得到了广泛应用,该方法无法监测被遮挡的鸟类个体,因此不适合于东方大苇莺的调查。综上所述,传统的调查与监测方法存在不同的弊端,有必要研究新的方法弥补以上不足。大苇莺鸣唱语句的起始部分在个体内较为保守,相对集中的体现个体特征,以此为理论依据,利用声音采集设备以及个体识别软件,基于鸣声识别东方大苇莺个体,实现东方大苇莺的调查与监测的方法,不仅可以克服上述缺点,而且是高效率、非损伤、低干扰、大范围的监测方法,具有巨大的应用前景。

目前常用的鸟鸣声分类方法包括:1、基于模板匹配的分类方法,最具代表性的就是动态时间规整算法,该方法虽然识别精度较高,但是运算量太大,影响识别效率。2、建立基于特征的分类模型实现分类,常用的模型或方法有隐马尔可夫模型、高斯混合模型、支持向量机、随机森林、自主神经网络、k最近邻以及集成学习等,该类方法中手动提取合适的差异特征仍是一大瓶颈;3、基于深度学习的分类方法,该类方法将深度卷积神经网络引入鸟鸣声识别中,利用其优异的学习能力突破手动提取鸟鸣声差异特征的瓶颈。H.V.Koops利用深度神经网络(Deep Neural Network,DNN)实现了基于鸣声的鸟类识别,并对比了不同输入时的识别效果,结果表明采用音频信号的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)、delta-MFCC以及delta-delta-MFCC相结合的输入时,识别效果最佳。I.Potamitis研究发现,利用语图特征基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)进行分类时,选择音节特征作为输入比选择鸣唱特征的分类效果更好。K.J.Piczak以音频信号的梅尔频域功率谱图为输入,对比了3种不同结构的DCNN的识别效果,结果表明输入功率谱图的大小、网络的层数以及网络结构都会对识别效果产生影响;将同一音频信号中,采用不同区域作为输入时的识别结果求均值,可以提高识别的准确率。

利用深度卷积神经网络,基于鸣声识别鸟类物种的方法可以通过训练自动获取特征,但是训练深度卷积神经网络需要大量的样本数据,因为鸟类物种鸣声存在地域差异不能直接用网上下载的鸣声进行训练和验证,而实地采集的鸣声样本又有限,小样本训练深度神经卷积网络容易导致过拟合,使得模型的识别精度下降。另外,现有技术中基于灰度图的灰度共生矩阵求取代表鸟类差异的特征值,选择的特征单一,无法具有更好的通用性能



技术实现要素:

本发明的目的在于提供一种基于多特征融合迁移学习的鸟类识别方法,以解决现有技术在识别鸟类时存在研究对象单一、计算效率差、对实地样本要求高的问题。

为达到上述目的,本发明采用下述技术方案:

一种基于多特征融合迁移学习的鸟类个体识别方法,包括:

S1、对已知的鸟鸣信号进行预处理,包括

采用预加重补偿鸟鸣信号在高频能量上的损失,进行维纳滤波滤除背景噪声,对鸟鸣信号进行分割处理,去除静音区;

S2、对预处理后的鸟鸣信号进行分帧和加窗处理,得到定帧长的鸟鸣信号,对得到的定帧长的鸟鸣信号进行线性调频小波变换,将其展开成一系列线性调频小波基函数的线性组合,利用小波系数生成语图,

选择的线性调频母小波基函数为:

其中,t为时间、tc为时间中心、fc为频率中心、△t为持续时间、c为线性调频率;

S3、对深度卷积神经网络Inception-ResNet-v2进行处理,得到预训练模型;

S4、将S2中生成的语图输入到S3的预训练模型中获得不同层的特征向量,对获取的不同层的特征向量进行融合,得到最终的特征向量;

S5、将最终的特征向量输入到支持向量机SVM中,进行训练,获得识别模型;

S6、对得到的识别模型进行性能检测,选取最终的识别模型;

S7、将待测鸟鸣信号按照步骤S1、S2、S4进行处理得到最终的特征向量,将特征向量输入到S6的最终的识别模型中进行识别,输出鸟类的种类和数量。

优选地,所述步骤S3对深度卷积神经网络进行处理包括:去除所述深度卷积神经网络的输出层;将用于迁移到识别模型的特征提取部分的网络进行冻结。

优选地,所述步骤S4选取三个不同层的特征,分别对三个特征池化得到三个不同的特征向量。

优选地,所述步骤S6包括:利用项目组已标记好的鸣声库作为训练或识别的数据,采用十折交叉验证法来验证识别模型的准确性,根据准确率(Precision)、召回率(Recall)和F值三个参数综合评价识别模型的性能。

本发明的有益效果如下:

本发明所述技术方案考虑到实地采集的鸟鸣声样本有限,利用深度学习模型提取的多特征进行融合,实现基于迁移学习的鸟类个体识别方法,该方法对样本需求小,同时可以大大缩短训练时间,提高识别准确率,具有通用性。通过采用本发明所述技术方案对鸟类的识别和数量研究,为研究和保护鸟类多样性及鸟类生活环境提供了可靠便利的条件。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的说明。

图1示出一种基于多特征融合迁移学习的鸟类个体识别方法的流程示意图;

图2示出采用线性调频小波转化语图的对比图。

具体实施方式

为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。

如图1所示,本发明公开了一种基于多特征融合迁移学习的鸟类个体识别方法的流程示意图。对已知的鸟鸣信号进行预处理、分帧、加窗,得到定帧长的鸟鸣信号;再利用线性调频小波变换,将其展开成一系列线性调频小波基函数的线性组合,利用小波系数生成语图,其中选择的线性调频母小波基函数为:

式中,t为时间、tc为时间中心、fc为频率中心、△t为持续时间、c为线性调频率;对深度卷积神经网络Inception-ResNet-v2进行处理,去除所述深度卷积神经网络的输出层,将用于迁移到识别模型的特征提取部分的网络进行冻结得到预训练模型,将语图输入到预训练模型中选取不同层的特征,分别对不同层特征池化得到对应的特征向量,融合后得到最终特征向量;将最终的特征向量输入到支持向量机中进行训练,得到识别模型,对得到的识别模型进行性能检测,利用项目组已标记好的鸣声库作为训练或识别的数据,采用十折交叉验证法来验证识别模型的准确性,根据准确率(Precision)、召回率(Recall)和F值三个参数综合评价识别模型的性能,选取最终的识别模型;将待测鸟鸣信号按上述步骤处理,即进行预处理、分帧加窗转换语图、输入到神经网络,得到不同层的特征向量,融合后得到最终的特征向量,将特征向量输入到最终的识别模型中进行辨别,输出鸟类的种类和数量。

由上述方法,本发明可进一步的将选取的不同层的特征可进行排列组合融合形成不同的特征向量,分析对应的识别效果,以选择最为合适的特征组合,从而得到最优识别模型。

为了进一步说明,本发明提供如下实施例。

首先对已知的东方大苇莺的鸟鸣信号进行预处理,通过预加重补偿东方大苇莺的鸟鸣信号在高频能量上的损失,然后对其进行维纳滤波滤除背景噪声,最后对鸟鸣信号进行分割处理,去除静音区。

根据东方大苇莺的鸟鸣时间长度,本实施例选取帧长为25ms。将预处理后的鸟鸣信号进行分帧和加窗处理,得到多个帧长为25ms的东方大苇莺的鸟鸣信号,线性调频小波转换成的语图有更好的识别效果,如图2所示。对得到的定帧长的东方大苇莺鸟鸣信号进行线性调频小波变换CT,将其展开成一系列线性调频小波基函数的线性组合,利用小波系数生成语图,选择的线性调频母小波基函数为:

其中,t为时间、tc为时间中心、fc为频率中心、△t为持续时间、c为线性调频率,由此得出多个语图。

本实施例选取深度卷积神经网络Inception-ResNet-v2,去除所述深度卷积神经网络的输出层,将用于迁移到识别模型的特征提取部分的网络进行冻结得到预训练模型,将上述东方大苇莺的语图输入到预训练模型中。深度卷积神经网络不同层获取的特征不同,越底层的特征越局部、越通用,而越高层的特征则越全局、越特定,为了充分利用不同层输出的特征,选取三个不同层的特征,分别对三个特征池化得到三个不同的特征向量,将其融合后得到最终特征向量。

支持向量机(Support Vector Machine,SVM)可以利用小样本实现高效分类,将最终的特征向量输入到支持向量机SVM中进行训练,得到识别模型,对得到的识别模型进行性能检测,利用项目组已标记好的鸣声库作为训练或识别的数据,采用十折交叉验证法来验证识别模型的准确性,根据准确率(Precision)、召回率(Recall)和F值三个参数综合评价识别模型的性能,选取最终的识别模型。

将待测鸟鸣信号进行预处理、分帧加窗转换语图、输入到神经网络,得到不同层的特征向量,融合后得到最终的特征向量,将待测鸟鸣信号特征向量输入到已训练好的识别模型中识别,判断鸟的种类是否为东方大苇莺,若为东方大苇莺则同时输出东方大苇莺的数量。

本发明所述技术方案能够解决实地采集的鸟鸣声样本有限的问题,利用深度学习模型提取的多特征进行融合,实现基于迁移学习的鸟类个体识别方法,大大缩短训练时间,提高识别准确率,同时适用于其他鸟类的识别,具有通用性。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1