一种基于特征值聚类的声学信号模式分类方法

文档序号：34383634发布日期：2023-06-08 04:48阅读：63来源：国知局

本发明属于声学信号模式分类，具体涉及一种基于特征值聚类的声学信号模式分类方法。

背景技术：

1、聚类是一种无监督模式分类技术，一般不需要人工对数据进行标注，但需要事先确定好聚类的类型数目。在各种聚类技术里，谱聚类是近年来发展迅猛的一种聚类技术，它在初始阶段有点类似传统的层次聚类法，即构造全体参与聚类的数据之间的互相似性度量(或互相异性度量)，该度量是一张n×n阶的对称矩阵表，n即为参与聚类的全体原始数据的个数。然后计算该矩阵的谱分解，并对特征矢量矩阵(即相似矩阵)进行标准化(施密特正交化、及单位化)，在借鉴传统的pca统计分析方法的基础上进行降维，根据特征值的大小分布，取集中的一部分(占据总值80％以上份额)特征值所对应的部分特征矢量矩阵进行聚类。该部分特征矢量矩阵的行数仍旧是参与聚类的全体原始数据的个数，但列数已经低于n了，这就是pca降维运用的结果。对所有的部分特征矢量矩阵的行向量进行k均值聚类,最后将聚类结果对应到原始数据从而得到真正需要的原始数据的分类情况。

2、谱聚类的缺点是当参与聚类的原始数据个数很多，即n很大，那么即便采用pca降维后，参与k均值聚类的部分特征矢量矩阵的行向量的维数也是足够大的，这对k均值聚类无疑是一种负担。此外，最后怎么将部分特征矢量矩阵的行向量的聚类情况对应到原始数据的分类，一般认为，部分特征矢量矩阵的行向量个数是与参与聚类的原始数据的个数是相同的，直接将第一行对应到第一个原始数据，第二行对应到第二个原始数据，……,依次类推。

3、声学信号类型识别是各类声学工程解决方案的关键问题。例如，在声学降噪领域，无论主动降噪还是被动降噪，均涉及到噪声和有效声信号的区分。对于单声道盲降噪(一种被动降噪模式)，需要根据信号频谱分析进行背景噪声和前景声音的区分；对于多声道被动降噪，需要区分声学bin的方向、并跟踪；对于多声道主动降噪，需要识别背景噪声、前景音，然后生成反相位的背景音。

4、在声学回声消除里，使用信号分离技术实现回声消除、或dtd语音双工检测都需要识别、辨别近端信号和远端信号。在声学信号定位里，需要辨别不同方位的源信号和干扰信号。在鸡尾酒效应中，需要将人声、乐音，或者男声、女声，抑或是不同语种的语音进行分离，同样需要辨识不同的信号，这些都是使用不同技术实现声学信号识别的例子。

技术实现思路

1、针对现有技术中存在的上述问题，本发明的目的在于提供一种基于特征值聚类的声学信号模式分类方法，其能够降低聚类矢量的维数，不需要使用pca技术进行降低维度处理，从而使得计算效率达到最优。

2、本发明提供如下技术方案：

3、一种基于特征值聚类的声学信号模式分类方法，包括以下步骤：

4、s1、使用固定时长将时域声音信号划成连续的帧片段，利用傅立叶变换，将各片段转换成频谱片段；

5、s2、使用频谱片段的矢量间的相似度量/相异度量构造相似/相异的度量矩阵；

6、s3、将度量矩阵进行谱分解，得到特征矢量矩阵p和特征值组成的谱矩阵；

7、s4、对谱特征值序列进行k均值聚类，得到k组结果；

8、s5、将特征值聚类的结果映射到频谱片段集合。

9、进一步的，所述步骤s1中，各片段的频谱为待聚类的原始数据，其均是维数为d的矢量，将原始数据记为矢量组，表示如下：

10、

11、其中，n为片段数，即原始数据的个数。

12、进一步的，所述步骤s2中，矩阵为实对称矩阵；相异度量采用欧氏距离，相似度量采用相关性系数、peasrson相关系数或关于欧氏距离的减函数。

13、进一步的，所述步骤s2的具体过程如下：

14、从原始数据中选取数据和将数据和的相似或相异度量值记作：

15、

16、其中，和

17、则度量矩阵表示如下：

18、

19、进一步的，所述步骤s3中，谱矩阵的表示如下：

20、

21、该谱矩阵与度量矩阵的关系如下：

22、

23、进一步的，所述步骤s4的具体过程如下：

24、对谱特征值序列{λ1，λ2，…，λn}进行k均值聚类，得到k组结果，

25、

26、

27、……

28、

29、其中，n1+n2+...+nk＝n。

30、进一步的，所述步骤s5的具体过程如下：

31、s5.1将原始数据的矢量通过线性插值，使得维数达到原来维数与n的最小公倍数；

32、s5.2将某原始数据与k个类别里每个类别对应的各个特征矢量逐一作内积，并取每个类别的平均投影值，将该原始数据归属于平均投影值最大的类别；即完成了将特征值聚类的结果映射到原始数据的分类。

33、通过采用上述技术，与现有技术相比，本发明的有益效果如下：

34、1)本发明直接使用特征值进行k均值聚类，聚类矢量为一维纯量，不需要使用pca技术进行降低维度处理，从而使得计算效率达到最优，适用于声学降噪、声学回声的dtd检测、回声分离以及声源定位等技术领域；

35、2)本发明中，将原始数据进行插值，使之维数与特征矢量的维数一致，即采用向特征矢量投影的排序方式，将特征值聚类的具体情况对应到原始数据。

技术特征：

1.一种基于特征值聚类的声学信号模式分类方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于特征值聚类的声学信号模式分类方法，其特征在于所述步骤s1中，各片段的频谱为待聚类的原始数据，其均是维数为d的矢量，将原始数据记为矢量组，表示如下：

3.根据权利要求2所述的一种基于特征值聚类的声学信号模式分类方法，其特征在于所述步骤s2中，矩阵为实对称矩阵；相异度量采用欧氏距离，相似度量采用相关性系数、peasrson相关系数或关于欧氏距离的减函数。

4.根据权利要求3所述的一种基于特征值聚类的声学信号模式分类方法，其特征在于所述步骤s2的具体过程如下：

5.根据权利要求4所述的一种基于特征值聚类的声学信号模式分类方法，其特征在于所述步骤s3中，谱矩阵的表示如下：

6.根据权利要求5所述的一种基于特征值聚类的声学信号模式分类方法，其特征在于所述步骤s4的具体过程如下：

7.根据权利要求1-6任一所述的一种基于特征值聚类的声学信号模式分类方法，其特征在于所述步骤s5的具体过程如下：

技术总结
一种基于特征值聚类的声学信号模式分类方法，属于声学信号模式分类技术领域。它包括以下步骤：S1、使用固定时长将时域声音信号划成连续的帧片段，利用傅立叶变换，将各片段转换成频谱片段；S2、使用频谱片段的矢量间的相似度量/相异度量构造相似/相异的度量矩阵；S3、将度量矩阵进行谱分解，得到特征矢量矩阵P和特征值组成的谱矩阵；S4、对谱特征值序列进行k均值聚类，得到k组结果；S5、将特征值聚类的结果映射到频谱片段集合。本发明直接使用特征值进行k均值聚类，聚类矢量为一维纯量，不需要使用PCA技术进行降低维度处理，从而使得计算效率达到最优，适用于声学降噪、声学回声的DTD检测、回声分离以及声源定位等技术领域。

技术研发人员：陆成刚,张卫,魏小彬,杨利中,南哲,白晓迪
受保护的技术使用者：浙江工业大学
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陆成刚张卫魏小彬杨利中南哲白晓迪
技术所有人：浙江工业大学
我是此专利的发明人