基于多特征融合及特征选择的乐音信号分类方法与流程

文档序号:11390514阅读:566来源:国知局
基于多特征融合及特征选择的乐音信号分类方法与流程

本发明涉及一种乐音信号分类方法。特别是涉及一种基于多特征融合及特征选择的乐音信号分类方法。



背景技术:

乐音信号分类的过程主要包括特征提取、分类器分类两部分。这是乐音信号分类领域使用最广泛的框架,而且分类准确率也较高。目前大多数研究者主要围绕如何提取到能更好反映信号信息的特征和分类器的选择两个方面来研究如何提高分类的准确率。

用来反映乐音信号信息的特征主要分为三类,包括音色特征、节奏特征和音高特征。除此之外,还有一些很好的特征可以反映乐音信号的特征,例如基于音程的频谱散度、基于音程的调制频谱散度等。

有很多分类器可以被用来决定歌曲的类型,例如高斯混合模型、支持向量机技术、隐马尔科夫模型等。

在传统的特征选择中,可能会有部分特征是冗余的或者是不相关的。冗余特征会使得提取的特征对乐音信号的某一方面进行了过多的表达,而不相关特征本身不会对分类结果产生任何影响,也就是说,做了很多无用功来分析处理这种特征。虽然多特征融合有助于更全面地表达乐音信号的特性,但是却产生了很高的维度。较高的维度往往会造成维度灾难,即不同特征之间可能会有部分的重叠,相当于对乐音信号的某一方面进行了过多地表达,而忽略了其他方面,这反而又会降低分类的准确率。



技术实现要素:

本发明所要解决的技术问题是,提供一种在保证学习准确率不下降的前提下具有更快学习速度的基于多特征融合及特征选择的乐音信号分类方法。

本发明所采用的技术方案是:一种基于多特征融合及特征选择的乐音信号分类方法,包括如下步骤:

1)歌曲划分,将一首歌曲划分成许多易于提取特征的小段;

2)特征提取,从时域和频域两个方面来提取反映乐音信号信息的特征;

3)特征选择,去除特征中的冗余特征;

4)多特征融合,把不同的特征按照一定的比例融合成一个融合特征;

5)分类和多数投票,采用极限学习机进行分类,根据分类结果进行多数投票得到最终的分类结果。

步骤1)所述的歌曲划分,是将一段歌曲分成许多段相互覆盖的纹理窗口,再将每段纹理窗口分成许多段相互覆盖的分析窗口。

步骤2)所述的从时域和频域两个方面来提取反映乐音信号信息的特征,是在分析窗口从时域和频域两个方面提取反映乐音信号的短时的特征;所述纹理窗口提取的特征是反映乐音信号变化的特征,具体是所有在分析窗口提取特征的均值和方差。

步骤3)包括:

(1)按音乐流派对每一个信息的特征进行分类,并计算分类准确率,找出分类准确率最高的特征放入特征子集中;

(2)将剩余的每一个特征分别与特征子集中的特征一起计算分类准确率,找出分类准确率最高的特征放入特征子集中;

(3)重复步骤2),在特征子集中得到m个特征和一个分类准确率;

(4)对特征子集中每m-1个特征一起计算分类准确率,共得到m个分类准确率;

(5)在m个分类准确率和特征子集中已有的一个分类准确率中找出一个最高的分类准确率;

(6)将步骤5)中最高分类准确率和对应所述最高分类准确率的特征集合共同作为新的特征子集;

(7)当最高的分类准确率是步骤3)中已有的分类准确率时,返回步骤3),否则返回步骤4),直到特征子集中的特征集合和最高分类准确率不再变化。

第(1)步所述的分类是采用极限学习机来进行分类。

所述的计算分类准确率就采用如下公式:

式中,n为音乐流派的个数,data为混淆矩阵,datai,j为混淆矩阵第i行第j列的值。

步骤4)包括:按音乐流派进行分类并对每一个特征进行分类准确率计算,将分类准确率由高至低设为:对分类准确率最高的特征分配以1的权重,次高的特征分配以的权重,以此类推得到所有特征在特征融合时的权重,对所有特征按照所述权重进行融合得到的融合特征。

步骤5)所述的多数投票,是通过极限学习机预测每一个纹理窗口的流派,占有窗口最多的流派为这首歌曲的流派,即为分类结果。

本发明的基于多特征融合及特征选择的乐音信号分类方法,将特征选择引入乐音信号分类中,选取最精简却最有效的特征子集来避免维度灾难,提高分类准确率,从而在保证学习准确率不下降的前提下具有更快学习速度的分类方式。相比传统的多特征融合的分类准确率提高了三个百分点。因此本发明提出的基于分类准确率的多特征融合方法可以在一定程度上提高分类准确率。

附图说明

图1是本发明基于多特征融合及特征选择的乐音信号分类方法的流程图;

图2是单特征、多特征融合以及本发明的多特征融合的分类准确率对比图;

图2中,特征1是调制频谱散度;2是调制频谱平整度和调制频谱峰值;3是梅尔频率倒谱系数;4是基于音程的频谱散度;5是标准化声音频谱包络;6是过零率;7是频谱峰值因子;8是频谱下降率;9是谱平度;10是频谱音高色度;11是频谱斜率;12是自相关系数;13是最大自相关;14是峰值包络;15是预测率;16是标准差;17是传统的多特征融合;18是改进后的多特征融合。

图3是选择不同数量的特征的最优分类准确率对比图。

具体实施方式

下面结合实施例和附图对本发明的基于多特征融合及特征选择的乐音信号分类方法做出详细说明。

本发明的基于多特征融合及特征选择的乐音信号分类方法,将特征选择引入乐音信号的自动分类中,采用基于wrapper框架的序列浮动选择算法来进行特征选择,此外还提出一种新的基于分类准确率的多特征融合方式,为提高乐音信号分类的准确率和效率有效地提供了帮助。

如图1所示,本发明的基于多特征融合及特征选择的乐音信号分类方法,包括如下步骤:

1)歌曲划分,将一首歌曲划分成许多易于提取特征的小段;

所述的歌曲划分,是将一段歌曲分成许多段相互覆盖的纹理窗口,再将每段纹理窗口分成许多段相互覆盖的分析窗口。

2)特征提取,从时域和频域两个方面来提取反映乐音信号信息的特征;

所述的从时域和频域两个方面来提取反映乐音信号信息的特征,是在分析窗口从时域和频域两个方面提取反映乐音信号的短时的特征,信号从时域到频域上的转化可以通过离散傅里叶变换来实现;所述纹理窗口提取的特征是反映乐音信号变化的特征,具体是所有在分析窗口提取特征的均值和方差。

3)特征选择,去除特征中的冗余特征;

特征选择算法一般是由生成不同特征子集的搜索算法、对某个特定的特征子集进行评价的评价方法和停止条件三部分构成。根据在特征选择时是否需要对特征子集进行分类,可以将特征选择分为两类:filter类型和wrapper类型。wrapper类型的特征选择是直接以得到更高的分类准确率为目标的,所以这它通常比filter类型的特征选择得到的结果更好。本发明采用的特征选择算法是基于wrapper类型的增l去r选择算法。

本发明的特征选择是使用序列浮动选择算法,序列浮动选择算法也包括序列浮动前向选择和序列浮动后向选泽两种算法。序列浮动前向选择算法同样是从空集开始,然后每次在未选择的特征中选择一个特征,使得添加这个特征后的特征子集的特征函数值达到最优,然后在已选择的特征子集中再选择一个子集,使得去除这个特征子集后的特征子集的特征函数值达到最优。因此,如果特征子集的特征函数不能再优化,那么就根本不需要进行回溯过程。序列浮动后向选泽算法也是同样的道理。在算法过程中回溯过程是动态控制的,所以根本不需要设置任何参数。

本发明的特征选择具体包括:

(1)按音乐流派对每一个信息的特征进行分类,并计算分类准确率,找出分类准确率最高的特征放入特征子集中,所述的分类是采用极限学习机(elm)来进行分类;

(2)将剩余的每一个特征分别与特征子集中的特征一起计算分类准确率,找出分类准确率最高的特征放入特征子集中;

所述的计算分类准确率就采用如下公式:

式中,n为音乐流派的个数,data为混淆矩阵,datai,j为混淆矩阵第i行第j列的值。

(3)重复步骤2),在特征子集中得到m个特征和一个分类准确率;

(4)对特征子集中每m-1个特征一起计算分类准确率,共得到m个分类准确率;

(5)在m个分类准确率和特征子集中已有的一个分类准确率中找出一个最高的分类准确率;

(6)将步骤5)中最高分类准确率和对应所述最高分类准确率的特征集合共同作为新的特征子集;

(7)当最高的分类准确率是步骤3)中已有的分类准确率时,返回步骤3),否则返回步骤4),直到特征子集中的特征集合和最高分类准确率不再变化。

4)多特征融合,把不同的特征按照一定的比例融合成一个融合特征;包括:

按音乐流派进行分类并对每一个特征进行分类准确率计算,将分类准确率由高至低设为:对分类准确率最高的特征分配以1的权重,次高的特征分配以的权重,以此类推得到所有特征在特征融合时的权重,对所有特征按照所述权重进行融合得到的融合特征。

5)分类和多数投票,采用极限学习机(elm)进行分类,根据分类结果进行多数投票得到最终的分类结果。所述的多数投票,是通过极限学习机预测每一个纹理窗口的流派,占有窗口最多的流派为这首歌曲的流派,即为分类结果。

本发明实施例中分析窗口的大小为23ms,纹理窗口的大小为9s,从时域和频域两个方面来提取反映乐音信号信息的特征,共提取了16种特征。从而根据一首曲子的每一段纹理窗口特征来决定这首曲子的流派。

从图2中可以看出本发明的本发明的基于多特征融合及特征选择的乐音信号分类方法确实会提高分类准确率。图中还列出了对单个特征进行分类的分类准确率,可以看到最差的分类准确率有31%,而最好的分类准确率有81%。本发明的方法也得到了实验结果的证实,可以看到传统的多特征融合得到的分类准确率只有82%,而本发明的方法得到的分类准确率却有85:6%之多,相比传统的多特征融合的分类准确率提高了三个百分点。因此本发明的基于多特征融合及特征选择的乐音信号分类方法确实可以在一定程度上提高分类准确率。

本发明采用了基于wrapper类型的序列浮动算法来进行特征选择,即每计算出一个备选的特征子集,都会对这个特征子集进行分类。本发明分别计算了提取不同数量的特征得到的分类准确率如图3所示。

从图3中可以看出本发明所采用的特征选择方法确实会提高分类准确率。当融合全部16种特征时得到的分类准确率只有82%,而当进行特征选择后分类准确率最高达到了89.5%之多,相比没有进行特征选择的分类准确率提高了七个百分点。这也确实说明了提取的16种特征中存在冗余特征或者不相关特征。通过观察可以看到,选择4种特征和选择11种特征都会达到89.5%的分类准确率,但是根据特征数量越少越好的原则,本发明选择4种特征即可,这是因为特征数量越少,分类时间越短,选择4种特征的分类时间是107s,选择16种特征的分类时间是348s,在保证分类准确率不下降的情况下分类时间越短越好,所以选择了这4种特征来进行分类。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1