一种基于深度学习的鸟类实时识别方法与流程

文档序号:23883918发布日期:2021-02-05 19:22阅读:664来源:国知局

[0001]
本发明涉及一种基于深度学习的鸟类实时识别方法,属于鸟类鸣声识别技术领域。


背景技术:

[0002]
鸟类的鸣声是其重要的生物学特征,与鸟类其他形态特征相同,由于进化的差异性,鸟类的鸣声在不同物种间也具有独特性,使得利用鸣声进行鸟类识别具有了可行性。
[0003]
近年来鸟类鸣声识别技术虽说有了不少研究成果,但总体来看发展相对缓慢,方法存在局限性。研究主要集中在特征参数选取、分类模型方法研究等方面,其中,常用的特征参数有幅度、频率、音节长度、声谱图、频谱图、短时能量、线性预测倒谱系数(linear predictive cepstral coding,lpcc)和梅尔倒谱系数(mel-frequency cepstrum coefficient,mfcc)等,常用的识别方法和分类模型有动态时间规整(dynamic time warping,dtw)算法、误差反传算法(errorback propagation,bp)算法、隐马尔可夫模型(hidden markov model,hmm) 和高斯混合模型(gaussian mixture model,gmm)等。存在有特征参数代表性不够强,以及受环境噪声影响较大等问题。


技术实现要素:

[0004]
针对现有方法的不足之处,本发明提供一种基于深度学习的鸟类实时识别方法。该方法有较强的抗交叉干扰项的能力,分辨率较高,将鸟类各种富于变化的鸣声特征提取出来作为分类依据,特征参数代表性更强,受环境噪声影响小,卷积网络集成于软件中,操作相对简单,识别准确度也会随卷积神经网络训练样本数量的增加而增加。
[0005]
本发明采用以下方案实现:一种基于深度学习的鸟类识别方法,其特征在于包括以下步骤:
[0006]
步骤1、监测外界环境中的声音信号,当存在非环境噪声信号出现时,进行鸣声信号的采集,并对信号进行预处理,预处理包括降噪以及音节提取,当短时间内仅有环境噪声存在则停止采集;
[0007]
步骤2、预处理后的信号,通过自适应时频分析算法获得时频谱图;
[0008]
步骤3、由鸟类鸣声数据库中下载相应鸟类样本,经数据扩充后,训练获得较优卷积神经网络模型进行分类识别;
[0009]
步骤4、得到不同类别的识别结果通过识别终端传到云服务器;
[0010]
本发明相对于传统方法,在面对鸣声片段持续时长变化较为剧烈的问题上,预处理采用对信号进行降噪,并提取出各种具有完整音节周期的片段,把鸣唱、鸣叫音节化,并通过音节叠加进行了样本数据扩充,将有效信号数据进行归一化及预加重,一定程度上提高了处理效率,采用自适应最优核时频分析方法: adaptive optimal kernel time-frequency representation(aok),时频分辨率高,且具有很强的抗交叉干扰项的能力,能够准确表现信号的时域、频域以及能量特征,通过卷积神经网络数据挖掘功能,可准确提取
时频分析图的特征,时频分析图灰度化后,经编译好的卷积神经网络算法提取特征,以灰度图为输入,鸟的种类为输出,训练神经网络,得到较优网络模型,在识别终端中调用,并能将结果上传云服务器。
附图说明
[0011]
图1为本方法的整体流程图。
[0012]
图2为本方法的卷积神经网络结构示意图。
具体实施方式:
[0013]
结合附图,对本发明,一种基于深度学习的鸟类识别方法,做进一步说明,如图1所示,主要包括鸣声信号监测、样本预处理、时频分析、卷积神经网络训练以及识别五个部分,具体步骤如下:
[0014]
步骤1、系统运行时监测外界环境中的声音信号,采样率14400khz,20ms 为一帧,采用高斯混合模型对噪声和鸣声进行建模,根据采集的连续50帧信号所对应的概率来进行判断采集的启停,并设置最大采集时长为9s,对采集到的信号进行预处理,即降噪以及音节提取,外界环境噪声多为加性噪声,则 y(m)=x(m)+d(m),在对应功率谱上相减并经逆变换可得鸣声信号,音节提取在高斯模型的基础上以连续20帧信号进行鸣声信号的检测,即进一步进行端点提取;
[0015]
步骤2、通过自适应最优核时频分析算法获得时频谱图,将图像进行灰度化处理,获得灰度矩阵,为减小神经网络运算量,调整图像的大小,此处调整为 64*64;
[0016]
步骤3、如图2所示,采用卷积核大小为7*7和6*6两个卷积层进行特征的提取,两个2*2的池化层进行降维,采用adam优化器、leaky relu函数作为激活函数以及卷积层后接batch normalization批标准化,将训练样本时频分析后的灰度图作为输入,导入卷积神经网络提取图像特征,以鸟的种类作为输出标准,训练得到较优网络;
[0017]
步骤4、得到不同类别的识别结果通过识别终端传到云服务器;
[0018]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等、均应包含在本发明的保护范围之内。
当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1