一种基于麦克风阵列的声目标分类方法

文档序号:8445885阅读:304来源:国知局
一种基于麦克风阵列的声目标分类方法
【技术领域】
[0001] 本发明涉及一种基于麦克风阵列的声目标分类方法,特别是涉及一种采用麦克风 阵列将声目标的声音信号特征和声目标的空间特征相结合的分类方法。属于声目标识别分 类技术领域。
【背景技术】
[0002] 利用声音信号来对目标进行分类一直是模式识别领域一个十分重要的课题。相 比较单麦克风,麦克风阵列富含更多的信息。利用这些信息可以实现声目标的定位,声信 号的增强以及干扰的抑制。在目前的利用麦克风阵列来对声目标进行分类的方法大部分 集中于这样的架构:先用波束形成对声音信号进行增强,然后将增强后的信号送入分类器。 在这种架构下,用于波束形成的方法的主要有最小方差无畸变响应(Minimum variance distortionless response, MVDR)和延时-求和(Delay and Sum)等。
[0003] MVDR虽然能够较好的抑制来自其它方向上的干扰,但是一方面由于有矩阵求逆操 作,计算量相对较大,另一方面经过MVDR处理后的信号,其分类效果有时候会反而不如延 时-求和算法。延时-求和主要是利用目标声信号在各个通道存在不同延时的特点,通过 算法估计出各个通道的延时,然后将各个通道按各自的延时在时间上进行移位,最后将移 位后的各个通道信号叠加相加,从而对目标声信号进行增强。但由于移位的长度等于延时 除以采样周期,这种算法受采样率制约,需要较高的采样率。与延时-求和方法是通过时间 上的移位来弥补各个通道之间声信号的时间差从而受限于采样率这一特点相比,本发明针 对这种信号增强后接分类器的分类算法架构,在波束形成的信号增强端采用常规波速形成 (CBF)的方法,通过调整各通道的相位来弥补通道间的时间差。
[0004] 此外,当利用麦克风阵列对声目标进行分类的时候。现有的分类器利用目标的空 间特征鲜有报道。然而目标角度变化量Λ Θ本身则是一个十分重要的空间特征,富含大量 的信息,例如当分类目标为运动车辆的时候,如果相邻两段声音信号时间间隔较短(比如 125ms),车辆离麦克风阵列较远时,Λ Θ趋于〇,当车辆离麦克风阵列较近时,Λ Θ变大,但 其值仍然在一个较小的区间中,且满足一定的函数关系。而噪声信号的角度变化量△ Θ的 特点是,即使相邻两段声音信号的时间间隔较短,定向角度Θ随时间的变化常常出现波动 甚至震荡现象,即Δ Θ取值很大且不满足运动车辆的Λ Θ所满足的函数关系。这是噪声 信号与运动车辆的信号一个差异十分显著的特征。所以将目标角度变化量Δ Θ作为一个 空间特征用于分类器可以提高声目标和噪声间的分类准确率。本发明拟首先通过常规波束 形成对各通道声音信号进行加权求和,以通过调整各个通道的信号相位来弥补其到达时间 差,然后再提取经常规波束形成后的信号的特征,将其再加上定向角度变化量的空间特征 一起作为新的特征,可望有效提高分类器的分类准确率及抗噪能力。从而构筑成本发明的 构思。

【发明内容】

[0005] 本发明的目的在于提供一种基于麦克风阵列的声目标分类方法,也就是说本发明 所要解决的技术问题是提供一种基于麦克风阵列的,环境适应能力强、性能可靠,具有较强 抗噪能力的声目标分类方法。
[0006] 本发明所提供的一种采用麦克风阵列的结合目标空间特征的声目标分类方法,具 体包括以下步骤:
[0007] (1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波 束形成;
[0008] (2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器 进行分类。
[0009] 所述的麦克风阵列的麦克风数量为2个或2个以上,排列方式为均匀排列或随机 排列。
[0010] 所述步骤(1)中的定向算法为现有的声阵列定向算法之一。可选用的算法有很 多,现有的能定向的算法均可选用,包括多重信号分类算法(MUSIC)、旋转不变子空间法 (ESPRIT)以及最大似然算法等。
[0011] 所述步骤(1)中的波束形成方法为常规波束形成(参见王永良"空间谱估计理论 与算法" P59,清华大学出版社),这实际上也是一个基本的算法,具体算法如下:
【主权项】
1. 一种基于麦克风阵列的声目标分类方法,其特征在于,包括以下步骤: (1) 麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形 成; (2) 将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行 分类。
2. 根据权利要求1所述的分类方法,其特征在于所述麦克风阵列的麦克风数量为2个 或2个以上,排列方式为均匀排列或随机排列。
3. 根据权利要求1所述的分类方法,其特征在于步骤(1)中所述的定向算法为现有的 声阵列定向算法之一。
4. 根据权利要求3所述的分类方法,其特征在于所述的定向算法包括多重信号分类算 法MUSIC、旋转不变子空间法ESPRIT或最大似然算法。
5. 根据权利要求1所述的分类方法,其特征在于步骤(1)中所述的常规波束形成算法 如下:
其中,c为一个调节信号幅度的常数,M为麦克风数目,Wi为第i个麦克风的加权值, Xi (t)为第i个麦克风所采集的信号,Ah表示流型矩阵A的共轭转置,X为麦克风阵列采集 信号的矩阵形式表达,Q ci为进行常规波束形成所选取的参考频点,τ i表示声音信号在第i 个阵元处的时移;常规波束形成的方向为定向算法所得出的目标方向。
6. 根据权利要求5所述的分类方法,其特征在于将波束形成使用常规波束形成的方法 对各个通道直接乘以一个加权值用以调整相位的方式来弥补时间差。
7. 根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的定向角度变化量 等于当前信号的定向角度减去其前一段信号的定向角度,提交分类算法的准确率和抗噪能 力。
8. 根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的提取常规波束形成 后信号特征的特征提取方法为现有的特征提取算法之一。
9. 根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的分类算法为现有的 分类算法之一。
10. 根据权利要求1-9任一项所述的分类方法,其特征在于直径为12cm的6阵元均匀 圆阵排列的麦克风阵列采集声音信号,利用麦克风阵列采集到的声响信号进行常规波束形 成,用相位差来弥补各个通道的时间差以增强信号,然后在传统特征提取算法所提取到的 特征的基础上,增加了一维描述空间变化的特征即定向角度的变化量,以提高分类器性能; 具体步骤是: (1) 麦克风阵列对声目标采用Music算法进行定向,t时刻定向出的角度为Θ t; (2) 根据定向出的角度0t对各个通道声音信号进行常规波束形成;即先按下式进行 加权:
C为一个调节信号幅度的常数取1/M,M = 6表示麦克风数目,Wi为第i个麦克风 的加权值,Xi(t)为第i个麦克风所采集的信号,Otl为进行常规波束形成所选取的参 考频点取340Hz,T i表示声音信号在第i个阵元处的时移,在俯仰角为0°的时候有
?其中r表示圆阵半径,为6cm,V表示声音在空气中的速度,常取 340m/s ; (3) 将常规波束形成后的信号y(t)提取其梅尔倒谱系数MFCC,其中梅尔滤波器组包含 24个滤波器,可以得到24维的梅尔倒谱系数,由于第一维表示直流分量,在取均值的条件 下,第一维数值很小将其去掉,最后得到23维的梅尔倒谱系数; (4) 将步骤(3)得到的23维的梅尔倒谱系数和定向角度变化量△ Θ -起构成一个24 维的包含信号特征以及目标空间特征的特征向量,将最后得到的特征向量送入高斯混合模 型GMM进行分类,式中Δ θ = θ^θ^。
【专利摘要】本发明涉及一种基于麦克风阵列的声目标分类方法,其特征在于包括以下步骤:(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类。本发明充分利用麦克风阵列的优势,不但提高了目标信号的信噪比而且提升分类算法的准确率和抗噪能力。具有环境适应能力强、性能可靠等优点,特别适用于需要对声目标进行连续监控的场合。
【IPC分类】G01S3-14, G06K9-62
【公开号】CN104766093
【申请号】CN201510151851
【发明人】郭峰, 黄景昌, 祖兴水, 程勇博, 刘华巍, 李宝清, 袁晓兵
【申请人】中国科学院上海微系统与信息技术研究所
【公开日】2015年7月8日
【申请日】2015年4月1日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1