一种基于一致聚焦变换最小二乘法的双声源定位方法

文档序号:9545955阅读:669来源:国知局
一种基于一致聚焦变换最小二乘法的双声源定位方法
【技术领域】
[0001] 本发明涉及声源定位领域,特别是一种基于一致聚焦变换最小二乘法的双声源定 位方法。
【背景技术】
[0002] 在阵列信号处理中,利用波达方向(Direction of Arrival,D0A)估计声源位置 是一个新的研究方向,在声呐探测(见文献:王燕,邹男,梁国龙.强多途环境下水听器 阵列位置近场有源校正方法[J].物理学报,2015, 64(2) :024304 1-10),语音识别与追 踪(见文献:戚聿波,周士弘,张仁和,任云.一种基于β-warping变换算子的被动 声源距离估计方法[J].物理学报,2015, 64(7) :074301 1-6),在未知环境中机器人的移 动(见文献:居太亮.基于麦克风阵列声源定位算法研究[D].博士学位论文(成都:电 子科技大学),2006),以及下一代助听器等(见文献:苏林,马力,宋文化,郭圣明,鹿 力成.声速剖面对不同深度声源定位的影响[J].物理学报,2015, 64(2) :024302 1-8) 领域中都成为研究的热点,精确的DOA估计在许多应用中都是其中的关键要素之一(见 文献:时洁,杨德森,时胜国.基于矢量阵的运动声源柱面聚焦定位方法试验研究[J]. 物理学报,2012, 61 (12) :124302 1-15)。其中,最常见的是在电话会议中,通过知晓说话 者扬声器的位置信息来引导相机,或者利用波束形成方法来增强捕获到的源信号,以避 免翻领式麦克风带来的不便(见文献:Despoina Pavlidi, Anthony Griffin, Matthieu Puigt,Athanasios Mouchtaris. Real-time multiple sound source localization and counting using a circular microphone array [J]. IEEE Transactions on Audio,Speech,and Language Processing,2013,21 (10):2193-2206.)〇
[0003] 在声源定位的早期研究中,主要针对单个声源进行定位的(见文献:Ali Pourmohammad j Seyed Mohammad Ahadi. Real time high accuracy 3_D PHAT-based sound source localization using a simple 4-microphone arrangement[J]. IEEE Systems Joumal,2012,6(3):455-468)。很多方法都是基于不同麦克风对间的到达时差(Time Difference of Arrival,TD0A)进行单声源定位的,其中广义互相关变换(Generalized Cross-Correlation PHAse Transform,GCC-PHAT)的方法是应用最为广泛的(见文献: Qilian LiangjBaoju ZhangjChenglin ZhaojYiming Pi. TDOA for passive localization underwater versus terrestrial environment[J]. IEEE Transactions Parallel and Distributed Systems, 2013, 24(10):2100-2108)〇 文献(Jingdong Chen,Jacob Benestyj Yiteng Huang. Time delay estimation in room acoustic environments: an overview[J]· EURASIP Journal on Applied Signal Processing,2006,26503:1-19)给 出了 ?)0Α方位估计技术的综述;在单声源中,由于存在噪声、混响等的干扰,会影响麦克风 对间采集的信号,使定位估计结果精度下降,文献(Francesco Nesta,Maurizio Omologo. Generalized state coherence transform for multidimensional TDOA estimation of multiple sources [J]. IEEE Transactions on Audio, Speech,and Language Processing, 2012, 20(1) :246-260.)给出了改进的TDOA估计方法。进一步研究发现, 同时定位多个声源是一个更困难的问题。事实上,即使是一个短暂的声音都会使采集 到的语音信号存在微小的重叠,可能会导致多个源信号的定位不精确(见文献:Jacek P. Dmochowski, Jacob Benesty, Sofiene Affes. Broadband MUSIC Opportunities and challenges for multiple source localization[C]. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2007:18-21)。对于多声源定位问题, 一种是传统的多信号分类(Multiple Signal Classification,MUSIC)方法,属于经典子 空间方法,该方法针对窄带信号,根据采集到信号的子空间协方差矩阵,进行特征分解,进 而估计源信号方位(见文献:Dumidu S. Talagala, Wen Zhang. Broadband DOA Estimation Using Sensor Arrays on Complex-Shaped Rigid Bodies[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2013, 21 (8) : 1573-1585.),由于语音信号的频 率带宽一般为[300Hz,3000Hz],经典子空间方法只是针对窄带信号的,会导致声源定位结 果不准确;另一种是基于独立分量分析的源定位方法,该方法首先运用盲源分离(Blind Source Separati〇n,BSS)方法获得分离后单个信号,然后再运用对单个源信号进行定位的 方'法进定位估计(见文南犬:Anthony Lombard, Yuanhang Zheng, Herbert Buchner, Walter Kellermann. TDOA Estimation for Multiple Sound Sources in Noisy and Reverberant Environments Using Broadband Independent Component Analysis[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011,19 (6):1490-1503.),但 此类源定位方法,由于将语音信号先分离再定位,会破坏源信号的完整性,会使定位结果不 稳定、定位精确度不高。另外,随着麦克风个数的增加,波达方向(DOA)估计的定位精度也 会随之提高,但在实际情况下,通常使用线性麦克风阵列模型,会产生定位模糊问题(无法 准确区分声源位于阵列的前方或者后方)。
[0004] 如何解决现有技术的不足已成为声源定位领域亟待解决的一大难题。

【发明内容】

[0005] 本发明所要解决的技术问题是为了克服现有技术的不足,而提供一种基于一致聚 焦变换最小二乘法的双声源定位方法,本发明方法实时、有效地解决多声源定位问题,在一 定程度上降低了噪声、混响等对语音信号的干扰,提高了定位的精度与稳定性。
[0006] 本发明为解决上述技术问题采用以下技术方案:
[0007] 根据本发明提出的一种基于一致聚焦变换最小二乘法的双声源定位方法,包括如 下步骤:
[0008] 步骤一:采用M个相同麦克风等间距的排列成半径为R的圆形麦克风阵列;
[0009] 步骤二:根据麦克风阵列采集到的语音信号,得到信号的协方差矩阵,并在给定频 率范围内定义中心频率点k b;
[0010] 步骤三:根据预设的一定测量范围内的任意角度,存在一个不随角度变化的一致 聚焦变换,定义一致聚焦变换矩阵,并通过最小二乘方法求得聚焦变换矩阵;
[0011] 步骤四:根据步骤二中定义的中心频率点,结合最小二乘法求得的一致聚焦变换 矩阵,采用MUSIC方法求得每个中心频率点所对应的信号空间谱,进而求得信号空间谱的 均值函数h alTay(0);
[0012] 步骤五:采用频率点均值和时间快拍估计的方法求得信号空间谱平均估计值,进 而求得声源估计角度。<
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1