一种基于自适应频率系数的鸟鸣声特征提取和识别方法

文档序号:36342815发布日期:2023-12-13 22:37阅读:52来源:国知局
一种基于自适应频率系数的鸟鸣声特征提取和识别方法

本发明涉及声音识别,特别是涉及一种基于自适应频率系数的鸟鸣声特征提取和识别方法。


背景技术:

1、鸟类作为环境监测的理想物种之一,能够敏感地感知环境变化,并通过鸟鸣声传递其种类特征信息,通过鸟鸣声可以识别鸟的种类。在声音识别领域,尤其是针对鸟鸣声的识别,精简且有效的声音特征与高精度的识别模型相结合是当前研究的关键。尽管现有的声音特征和识别技术在音乐和语音识别领域取得了显著的进展,但由于鸟类种类的多样性以及各种鸟鸣声的显著差异,针对鸟鸣声的声音特征及其计算方法仍需进一步研究,以提高识别准确度。

2、声音特征对鸟鸣声识别的准确度有直接的影响,常用的声音特征包括共振峰频率、线谱对、mel频率倒谱系数等。但这些方法使用形状固定的滤波器提取声音特征。如申请号为202211100596.3的中国专利申请使用了和mel频率倒谱系数一样的三角形滤波器。对于这种形状固定的滤波器每个滤波器与相邻滤波器的重叠部分无法控制。因此需要进一步优化改变每个滤波器的形状,以控制重叠部分,从而得到更适合鸟声识别的声音特征。


技术实现思路

1、发明目的:本发明的目的是提供一种识别准确更高的基于自适应频率系数的鸟鸣声特征提取和识别方法。

2、技术方案:为实现上述目的,本发明所述的一种基于自适应频率系数的鸟鸣声特征提取和识别方法,包括以下步骤:

3、步骤1:采集鸟鸣声信号,并进行预处理,获得功率谱p(k);

4、步骤2:引入自适应参数α,设计两组形状能够根据自适应参数α改变的频域信号过滤器h1m、h2m,并利用过滤器h1m、h2m分别对功率谱p(k)过滤频率,提取处理后信号s1(m)、s2(m)的自适应频率系数c1(n)、c2(n),以组成鸟鸣声特征向量x=[c1,c2];

5、步骤3:构造改进的非线性支持向量机分类模型f(x),并利用黑寡妇蜘蛛算法优化寻找到支持向量机分类模型f(x)中的最优核函数;

6、步骤4:将鸟鸣声特征向量x=[c1,c2]输入步骤3改进的支持向量机分类模型f(x)进行学习;

7、步骤5:利用已学习好的改进的支持向量分类模型f(x)对待识别鸟鸣声的特征向量进行鸟鸣声识别。

8、步骤1所述采集到的鸟鸣声信号为d(n),(n=0,1,2,…,n-1),n为鸟鸣声长度;

9、对d(n)做傅里叶变换:

10、

11、式中,r为虚数单位,d(k)表示鸟鸣声信号的功率谱中第k个数据,0≤k≤n-1。

12、所述功率谱p(k):

13、p(k)=|d(k0|2;

14、式中,p(k)表示鸟鸣声信号的功率谱中第k个数据。

15、步骤2所述第一组自适频域应信号过滤器h1m(k1)为:

16、

17、

18、式中,m表示过滤器序号;k1表示功率谱p(k)中数据;m表示使用的过滤器的个数;f1(m)、f1(m-1)、f1(m+1)表示第一组过滤器组中第m、m-1、m+1个过滤器的中心频率;α代表自适应参数,0≤α;fh代表鸟鸣声频率范围内的最高频率,fl表示鸟鸣声频率范围内的最低频率,f(z)=1127*ln(1+z/700),z是自变量。

19、步骤2所述第一组过滤器对功率谱p(k)过滤,提取处理后信号s1(m)的过程为:

20、

21、式中,n为鸟鸣声长度,0≤k≤n-1;

22、所述处理后信号s1(m)的系数c1(n)计算过程为:

23、

24、式中,l表示阶数,n1表示离散数据的序号。

25、步骤2所述第二组自适应频域信号过滤器h2m(k2)为:

26、

27、

28、式中,m表示过滤器序号;k2表示功率谱p(k)中数据;m表示使用的过滤器的个数;n为鸟鸣声长度;f2(m)、f2(m-1)、f2(m+1)表示第二组过滤器组中第m、m-1、m+1个过滤器的中心频率;α代表自适应参数,0≤α;fh代表鸟鸣声频率范围内的最高频率,fl表示鸟鸣声频率范围内的最低频率,ff(z)=2195-2595*log(1+(4031-z)/700),ff-1(z)=700(10z/2595-1),z是自变量。

29、步骤2所述第二组过滤器对功率谱p(k)过滤,提取处理后信号s2(m)的方法为:

30、

31、式中,n为鸟鸣声长度;0≤k≤n-1;

32、所述信号s2(m)的系数c2(n)计算过程为:

33、

34、式中,l表示阶数,n2表示离散数据的序号。

35、步骤3所述非线性支持向量机分类模型f(x)为:

36、

37、式中,t(xq,x)是核函数,将数据映射到高维度;x表示任一段鸟鸣声的特征向量,xq表示用于训练非线性支持向量机分类模型f(x)的鸟鸣声中第q段鸟鸣声的特征向量;yq为第q段鸟鸣声的分类标签,具体为-1或1,-1表示非此类鸟,1表示是此类鸟;aq为权系数,b为预设偏置参数,aq、b为待学习参数。

38、步骤3所述优化寻找支持向量机分类模型f(x)中核函数的最优核参数,从而得到最优核函数,其中,寻找过程中,位置的适应度为以当前位置为核参数的核函数,进行鸟鸣声识别的识别结果与实际相同的数量;具体包括以下步骤:

39、步骤301:将核参数作为黑寡妇蜘蛛的位置,初始化黑寡妇蜘蛛算法的种群数、最大迭代次数maxi,黑寡妇蜘蛛位置x(i,t+1)迭代过程为:

40、

41、其中,x(i,t+1)为蜘蛛i第t次迭代后的位置,x(best,t)是蜘蛛群目前时刻最优位置,m1、β和rd是随机数,范围分别为[0.5,1]、[-1,1]和[0,1],x(r1,t)为随机选取的第r1个蜘蛛的位置,x(i,t)为第i个蜘蛛当前时刻的位置;

42、步骤302:当信息素小于或等于0.3的个体,黑寡妇蜘蛛位置更新方法为:

43、

44、式中,r1和r2是不同的蜘蛛,cv为0或1;

45、步骤303:以黑寡妇蜘蛛的位置x(i,t+1)为核参数,计算适应度,更新最优位置,最优位置x(best,t+1)的计算方法为:

46、

47、步骤304:定义准确率作为适应度函数:

48、

49、其中,mm表示样本的总数目,cur表示以位置x(i,t)为核参数的非线性支持向量机分类模型f(x)识别正确样本的数目;

50、步骤305:判断迭代次数t是否小于maxi,若是,返回执行更新位置301,若否,则将此时黑寡妇蜘蛛的位置作为最优核参数。

51、步骤4所述的学习过程具体包括以下步骤:

52、步骤401:将鸟鸣声特征向量按照8:2比例随机划分为训练集和测试集;

53、步骤402:将训练集输入到改进的非线性支持向量机分类模型f(x)中,求出最优的待学习参数aq和b,aq为权系数,b为预设偏置参数,其中,求解aq时,aq应满足:

54、

55、且

56、任意选择一个鸟鸣声特征向量x*及x*对应的标签y*,求解b:

57、

58、步骤403:采用测试集评价学习后的改进非线性支持向量机分类模型f(x),通过调节自适应参数,使不同种类的鸟鸣声在不同自适应参数下有最优的性能,以得到最高的综合指标值,从而满足设定的评价标准值,则学习后的改进非线性支持向量机分类模型f(x)训练完成。

59、有益效果:本发明具有如下优点:本方法使用形状可变的频域信号过滤器,能够根据不同种类鸟的鸣叫声特征,自适应地提取更适合该种鸟的声音特征,从而提高了鸟鸣声识别的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1