一种srp声源定位的快速实现方法

文档序号:9325789阅读:815来源:国知局
一种srp声源定位的快速实现方法
【技术领域】
[0001] 本发明涉及声源定位技术,特别是一种SRP声源定位的方法。
【背景技术】
[0002] 声源定位技术主要分为3大类,即基于最大可控响应功率的波束形成方法、采用 高分辨率谱估计的方法和基于时延估计的两步定位方法。2002年,J. H. DiBiase (见文献 [1]J. H. DiBiase. A high-accuracy, low-latency technique for talker localization in reverberant environments[D]. Providence RI, USA:Brown University, 2000 和 文献[2]谭颖,殷福亮,李细林.改进的SRP-PHAT声源定位方法[J].电子与信息学 报,2006, 28(7) :1223 ~1227.见文献[3]Jacek P.Dmochowski.A Generalized Steered Response Power Method for Computationally Viable Source Localization. IEEE transactions on audio, speech, and language processing, VOL. 15, NO. 8, 2007)提出了 联合可控响应功率和相位变换(SRP-PHAT)的声源定位方法,该方法将可控响应功率方法 固有的鲁棒性、短时分析特征与时延估计中相位变换方法对信号周围环境的不敏感性相结 合,使声源定位系统具有一定的抗噪性、抗混响性。但是,SRP-PHAT方法运算量庞大,并且 在恶劣环境下(噪声干扰大、混响影响严重)性能急剧下降,因此在实时处理和实际应用时 变得困难。

【发明内容】

[0003] 发明目的:为了克服现有技术中存在的不足,本发明提供了一种SRP声源定位的 快速实现方法,用于解决现有的SRP-PHAT方法运算量打且恶劣环境下性能差的技术问题。
[0004] 技术方案:为实现上述目的,本发明采用的技术方案为:
[0005] -种SRP声源定位的快速实现方法,包括如下步骤:
[0006] 步骤1、利用基于凸优化的波束指向可调的宽带稳健远场频率不变波束形成器算 法得到Farrow结构波束形成器的最优权值,从而设计完成Farrow结构波束形成器;
[0007] 步骤2、利用Farrow结构波束形成器在调整波束指向时无需重新计算权值这个结 构特征,将各麦克风阵列的输入信号进行FFT运算,根据不同麦克风以及输入信号的阶数 将FFT运算后的输入信号进行两两相乘、求得相位加权函数;
[0008] 步骤3、将各麦克风阵列的输入信号输入至Farrow结构波束形成器中进行空域滤 波,空域滤波后的输出信号进行FFT运算,根据不同麦克风以及输出信号的阶数将FFT运算 后的输出信号进行两两相乘求得相位加权函数对应量,;
[0009] 步骤4、根据两个麦克风以及各自输入信号的阶数所确定的相位加权函数以及相 位加权函数对应量为一组进行对应,将属于同一组的相位加权函数与相位加权函数对应量 进行相乘,然后将相乘的结果进行IFFT运算之后并累加求和得到所有的麦克风中的两两 麦克风的广义互相关函数之和并进行锁存;
[0010] 步骤5、将两两麦克风的广义互相关函数之和与扫描角度唯一有关的调向参数D 进行乘积相加运算,得到相应扫描点的瞬时功率,搜索瞬时功率的最大峰值得到对应的指 向角度Θ / ;
[0011] 步骤6、对Farrow结构波束形成器的系统误差进行校准,并将步骤5中获得的指向 角度Θ /校准为最终的定位角度Θ P
[0012] 进一步的,在本发明中,所述步骤1的具体步骤为:基于凸优化的思想设计稳健波 束指向可调的频率不变波束形成器,稳健的最大误差最小化的优化设计的代价函数:
[0015] 上面代价函数(4)式中包含从上往下的3个式子:第一个式子表示的物理含义是 在主瓣范围内保证频率不变;第二个式子表示在旁瓣范围内需要对实际响应值小于一个上 限值,达到使旁瓣范围内的能量谱尽量小的目的;第三个式子的目的在于保证在指定波束 指向方向,参考频率f;以及参考方向上的波束响应为1。
[0016] 代价函数(4)式中:
[0017] g是导向量;△ g是导向矢量的误差;f是频率点;Θ是波达方向;Φ是波束指向角 度;ψ是预定义的可调方向范围、fk、θ η分别表示离散的可调方向角度点、频率点以 及波达方向角度点;是参考频率;Ω是感兴趣的频带范围;Z是预设的参数范围;Θ ρ是 主瓣角度范围;?s是旁瓣角度范围;ε表示将导向矢量误差Ag的模值控制在ε值的界 内;同理,η则表示其左侧的表达式的模值被认为控制在η值得界内;F是加权系数;/是 权值的转置;
[0018] 利用SeDumi软件对上式进行求解得出Farrow结构波束形成器的最优权值w。
[0019] 基于Farrow结构波束形成器始终只需一组固定的权值,通过调整调向参数D这一 参数,即可实现波束指向实时调整,无需重新求解权值,这正是我们设计的F arrow结构波 束形成器用于SRP声源定位法能够简化计算量的关键原因所在。
[0020] 所述步骤3中编号为j的麦克风阵元的输入信号经过Farrow结构波束形成器的 空域滤波作用后输出信号力为:
[0023] M是Farrow结构波束形成器中的滤波器的阶数;
[0024] 并且有:
[0026] (7)式中:
[0027] xk (t)表示第k个麦克风阵元的输入信号,这里的η表示离散形式;1"表示最优 权值w中的第k个麦克风阵元的第m阶滤波器的权值;K表示麦克风阵元的个数;
[0028] 根据Farrow波束形成器的结构,在这里Ani是只要通过一次计算之后就可以直接 锁存起来的数据。即输出信号y,只取决于调向参数D,即A ni可被直接锁存,从而达到实时 调整波束指向的目的。
[0029] 所述步骤2中,由Farrow结构波束形成器的SRP-PHAT方法的波束输出功率 Ρ( τ。,. . .,τ K D 定义为:
[00301
[0031] (8)式中:
[0032] 这里Ρ( τ。,. . .,τ κ J中的τ k表示第k个阵元相对于参考阵元的时延差; 为第k个麦克风接收到的输入信号Xk (t)的傅里叶变换;
[0033] 为第1个麦克风接收到的输入信号Xl(t)的傅里叶变换;是XiW)的 共辄转置;
[0034] 且有:
[0035]
[0036]
[0037] D1= ( Θ 厂90。)/90。 (11)
[0038] 这里i表示可调角度离散形式的每个离散点;
[0039] 多通道形式的PHAT的相位加权函数¥?(0?·)为:
[0040]
[0041] (12)式表述的含义:将每个麦克风阵元输入信号进行FFT运算之后再两两进行相 乘、取模、求倒数一系列运算之后得相位加权函数。
[0042] 所述步骤4运算量降低的具体表现原理:
[0043] 令:
[0044]
[0045] (13)式中:
[0048] (14)式子表示的含义是:第k个麦克风阵元、第m#FIR滤波器的输入信号·W 经过空域滤波之后得到的输出信号将被锁存在為,》;1的数据里。同理可解释(15)式中的 為,)? P
[0049] 这样很容易理解(13)式所表达的含义是:将锁存起来的数据即输入信号与权值 进行卷积再进行FFT后两两相乘,再与相应的加权函数进行相乘,IFFT运算之后累加求和, 可得所有麦克风两两麦克风的广义互相关函数之和并进行锁存在H里。这一系列的过程随 着权值的形成一步完成并锁存下来,无需重新计算。所述步骤4中利用Farrow结构波束形 成器特殊的结构优势,降低计算量的原理过程。
[0050] 所述步骤5中,按照Farrow结构波束形成器的结构图写出其瞬时功率:
[0052] 所述步骤5中按照Farrow结构波束形成器的结构图将调向参数D与已经锁存的 输出数据结合起来,达到调向的目的。
[0053] 所述步骤5中,传统的SRP-PHAT与本发明的Farrow-SRP-PHAT运算量对比:
[0054] 假设传统的SRP-PHAT中的常规波束形成器有K个阵元、每个阵元有N个抽头、扫 描点数为n'、信号序列长度为L点。
[0055] 复乘次数:n' *[N*K*L+K2*[(3/2)*L*log2L+3L]]次
[0056] 复加次数:n' *[ (N-I) *K*L+K2*[3*L*log2L] +(K2-I) *L]次
[0057] 假设本发明中的Farrow结构波束形成器有K个阵元、每个阵元有M阶N个抽头 FIR滤波器、扫
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1