一种基于一致聚焦变换最小二乘法的双声源定位方法_3

文档序号:9545955阅读:来源:国知局
声,假设噪声为零均值、稳定的白噪声,每个麦克风上的噪声能量是相 等的,并且噪声信号与声源信号间是相互独立的,则
[0069] 式中,E[*]表示期望的运算符,Im表示MXM的单位矩阵,H表示厄密共辄运算符, V(rd,k)表示导向矢量矩阵,σ:、表示噪声方差。
[0070] 在近场条件下,需要考虑每个声源与麦克风阵列间的距离,则导向矢量矩阵 V(rd,k) =V(rd,0d,k),其中,第d个分量为
[0072] 根据输入信号X(k),可求得信号的协方差矩阵Cx,为
[0073] Cx= E[X(k)X(k) H] (8)
[0074] 根据式(3)、(5)、(6),(^可进一步表示为
[0076] 式中,(^为源信号DXD阶协方差矩阵,Cb为噪声信号的协方差矩阵,
[0079] MXM阶矩阵Cy= V(r i,…,rD,k)CsVH(ri,…,r D,k),矩阵Cy满足埃尔米特对称、半 正定,因此可得M个实的、非负的第m个特征值X ni,以及相关的第m个正交特征向量UniOn = 1,…M)。这里假定声源信号间是相互独立的,V(ri,…,rD,k)为满秩矩阵,C y的秩为D那么 其特征值满足X1S λ 2彡…彡λ D> λ D+1=…=λ M= 〇。由上述推导可以注意到向量 U1,…,Ud与ν(Γι,…,rD,k)生成空间的范围是一致的,因此可根据导向矢量所形成的D维子 空间S来估计声源位置,且D维子空间S被称作信号子空间。
[0080] 根据
[0084] 式中,Us= (U1-Ud) e Rmxd为信号子空间S的矩阵,是由上述的特征向量所构成 的D阶矩阵,且与特征值A,,,+σ丨(/" = 1,·.·,/))相关;Un= (UD+1…UM) e RMX(MD)为噪声子空间 N的矩阵,是由余下的特征向量构成的M-D阶矩阵,且其特征值为h .
[0085] 信号子空间矩阵Us与噪声子空间矩阵U N有如下关系,
[0086] (Us IUN) H(US IUN) = Im (14)
[0087] (203)由于语音信号的频率带宽一般为[300Hz,3000Hz],为了在处理时确保语音 信号的完整性,在给定频率范围内划分频率间隔相等的B个子带,第b个子带的中心频率为 kb,其中,b = 1,...,B,这里取 B = 180。
[0088] 步骤三:根据一定范围内的任意角度,存在一个不随角度变化的一致聚焦变换,定 义聚焦变换矩阵,并通过最小二乘方法求解;
[0089] (301)对于一定测量范围内的任意角度(这里设定测量的范围为-90°~90° ), 存在一个不随角度变化的一致聚焦变换。根据带宽内定义的任意中心频率点kb以及给定 的聚焦频率点k。,定义一致聚焦变换矩阵T (r, kb),b = 1,…,B,任取(r, Θ ),有
[0090] V (r, Θ , k〇) = T (r, kb) V (r, θ , kb) (15)
[0091] 则变换T (r, kb)称为一致聚焦变换。
[0092] (302)利用最小二乘方法,对式(15)求解
[0094] 可得,一致聚焦变换矩阵
[0095] T (r, kb) = R (r, kb) L (r, kb) (17)
[0096] 式中,R(r,kb)为矩阵VH(r,Θ,kQ)V(r,Θ,k b)的左奇异矢量矩阵,L(r,kb)为矩阵 VH(r,Θ,k0)V(r,Θ,kb)的右奇异矢量矩阵;。
[0097] 步骤四:根据步骤二中定义的中心频率点,结合最小二乘法求得的一致聚焦变换 矩阵,利用MUSIC方法求得每个中心频率点所对应的信号空间谱,进而求信号空间谱的均 值函数;
[0098] 在每个中心频率点kb,计算T(r,kb)X(kb)的二阶统计量,再求和,结合式(12),得 输入信号的聚焦协方差矩阵,
[0100] 式中,Cx(kb)表不在中心频率点kb时,输入信号的协方差矩阵。
[0101] 根据式(15)、式(17),式(18)得
[0105] 式中,Cs(kb)表示在中心频率点kb时,源信号的协方差矩阵。
[0106] 根据式(19),可得噪声信号聚焦协方差矩阵为
[0110] 由输入信号的聚焦协方差矩阵rx(r)与噪声信号的聚焦协方差矩阵rN(r),可构 成矩阵对(rx(r), rN(r)),其第m个特征值为μη,且μη> μ n+1,第m个特征向量为Un,m =1,…,Μ。那么 Us (r) = (U1,…,UD),Un (r) = (UD+1,…,UM),且有
[0113] 基于上述分析,可得信号的空间谱函数为
[0115] 式中,Un (r)表示声源位置矢量的噪声子空间矩阵,下标N表示Noise (噪声)。
[0116] 然后,根据式(25),可得信号空间谱的均值函数,
[0118] 式中,下标array表示阵列,
[0119] 因为式(26)正交特性趋向于0,则平均空间谱函数的峰值所对应的角度Θ,即为 声源位置角度估计值。
[0120] 步骤五:结合实际情况:仅有麦克风采集到的语音信号可用,运用频率点均值和 时间快拍估计的方法求得信号空间谱平均估计值,进而求得声源估计角度;
[0121] 在实际中,由于(^是未知的,仅可以利用麦克风采集到的语音信号x(t),而且矢 量信号x(k)的复包络值也不能准确的确定。因此需要计算协方差矩阵C x、矢量信号X(k) 的近似值,这里采用时间快拍估计方法来求近似值。设时间系数t' =TidJIV^Tq表 示时间间隔,一方面x(t)以I (1为整数)速率进行采样,因此在每个t'上,在快拍为 jI
时,通过傅里叶级数(FS)估计X(k)的近似值为;另一方面, 在t'上估计Cx,运用W长度的滑动窗口在T。空间进行采样再由加权求和方法求得的估计 值替代定义的期望值。在W长度的窗口中,期望(^的近似值是完全基于化(/:)得到的,且二 者是相互独立的,这排除了快拍使用重叠的可能性,即
[0123] 式中,大%(幻表示输入信号在时间间隔为T。时,第1个傅里叶级数的近似值,L*」 为取整运算符;
[0124] 根据上述分析,式(26)可进一步表示为
[0126] 式中,?Λ.0-)表示声源位置矢量的噪声子空间矩阵仏㈦的近似值,下标N表示 Noise (噪声)。
[0127] 仿真环境为5. 5mX 3. 3mX 2. 3m的房间冲激响应模型,运用含有6个麦克风的圆形 阵列,相邻麦克风间的夹角为60°,阵列的直径为40cm,声速c = 343m/s,混响时间T6q = 250ms。根据近场条件,声源响应在r = 0.6m~1.6m范围内,据此设定声源角度为Θ 1 = 60°,距离阵列中心距离为0.7m,声源S2的角度为Θ 2=-20°,距离阵列中心距离为 I. 2m ;声源与阵列在同一个平面上,且二个声源信号相互独立、能量相等。环境噪声SNR分 别取0dB、5dB、10dB、15dB、20dB。对于采集的语音信号,设定帧长为512点,帧移为160点, FFT的长度为1024点,采样率为16000Hz,窗函数选择汉明窗,窗长取150点。
[0128] 实测环境为全消声实验室、非消声实验室,房间尺寸(5. 5mX3. 3mX2. 3m)、阵列摆 放位置与仿真环境相同,声源高度、阵列高度都为I. 2m,阵列为6个麦克风的圆形阵列。实 验器材:数据采集设备为16通道的PXIE-4496数据采集卡、配套PC机(Intel 2GHz Core i7CPU,2GB RAM);声源为AM012人工嘴、便携式音箱;麦克风为的简易声音传感器模块(全 向性,工作电压5V)。由于人工嘴在通电工作时产生的嘶嘶声、房间换气扇转动时产生的呼 呼声,实测环境下的信噪比平均为20dB。
[0129] 图3是本发明方法在相同混响时间(TJ,不同信噪比(SNR)条件下声源定位结果。 图4是本发明方法在不同混响时间、相同信噪比条件下声源定位结果。图5是本发明方法 与传统的MUSIC、BSS-TDOA方法的声源定位结果的比较。图6是本发明方法在全消声实验 室声源定位结果。图7是本发明方法在非消声实验室声源定位结果。图8是本发明方法仿 真实验与实测实验进行声源定位结果的比较。图3、图4、图5、图6、图7都是用来说明本发 明定位效果。
[0130] 相同混响时间(TJ、不同信噪比(SNR)条件下声源定位结果:
[0131] 混响时间为 T6。= 250ms,信噪比(SNR)不同分别为 20(^、15(^、10(^、5(^、0(18条 件下,六元麦克风阵列的声源定位结果。
[0132] 图3表明,在声源与阵列间距离的增加情况下,随着信噪比的降低
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1