一种声源定位方法及装置的制作方法

文档序号:5954566阅读:189来源:国知局
专利名称:一种声源定位方法及装置的制作方法
技术领域
本发明属于声音处理技术领域,尤其涉及一种声源定位方法及装置。
背景技术
在视频会议、安防或是在ー些エ业应用领域中常常需要对声源进行定位,但是在一些场合中,由于外部声源环境的不确定性,语音信号受到外界噪声干扰,使得信噪比发生变化,现有声源定位技术中,通过麦克风阵列得到ー组声音数据,再经过预处理后用相位变换广义交互相关方法(PHAT-GCC)进行时延估计,根据时延结果和麦克风阵列中麦克风的排列分布,通过几何模型即可确定声源的位置。由于现有的PHAT-GCC方法中,由于声源信号的信噪比可能会随环境发生变化,在信号能量较小的吋,进行频域加权的加权函数的分母
会趋于零,使得加权函数的取值变得非常大,这样获取的时延结果误差也较大,最后定位出的声源位置也会存在很大误差。

发明内容
鉴于上述问题,本发明的目的在于提供一种声源定位方法,g在解决现有声源定位技术中由于声源信号的信噪比发生变化时,加权函数的值可能变得非常大,使得声源定位结果误差很大的技术问题。本发明是这样实现的,一种声源定位方法,包括下述步骤麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述预处理后的两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。本发明的再一目的在于提供一种声源定位装置,包括麦克风阵列采集预处理单元,用于麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;互功率谱密度确定单元,用于确定经过所述预处理后的两路声源信号的互功率谱密度函数;加权函数确定单元,用于确定随当前信噪比变化而调整的加权函数;时延确定单元,用于根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;声源定位単元,用于根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。本发明的有益效果是由于本发明提供的声源定位方法和装置所采用加权函数能够随当前信噪比的变化做出相应调整,使得由于背景噪声、混响等因素的影响,在声源信噪比改变的环境下,通过相应调整加权函数,亦可准确获取声音信号的时延,提高了声源定位精度。


图I是本发明第一实施例提供的 声源定位方法的流程图;图2是本发明第二实施例提供的声源定位方法的流程图;图3是本发明第三实施例提供的声源定位装置的结构方框图;图4是本发明第四实施例提供的声源定位装置的结构方框图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进ー步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。实施例一:图I示出了本发明第一实施例提供的声源定位方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。本发明实施例提供的声源定位方法包括步骤S101、麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理。麦克风阵列是多个麦克风按照一定方式排列的麦克风集合,在声源定位技术中常用于声源信号采集,可以得到一组声源信号,在本步骤中,任取其中的两个麦克风采集到的声源信号进行预处理,包括滤波和分帧等。步骤S102、确定经过所述预处理后的两路声源信号的互功率谱密度函数;步骤S103、确定随当前信噪比变化而调整的加权函数;步骤S104、根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延(时间差)。 步骤S102-S104提供了确定声源信号到达两个麦克风的时延的过程,确定时延的精确度决定了声源定位的精确度,一般的时延确定方法是首先确定两路声源信号的互功率谱密度函数、以及加权函数,再根据所述互功率谱密度函数和加权函数的乘积进行傅立叶逆变换得到两路信号的互相关函数的值序列,根据所述互相关函数的最大值确定所述时延。但是现有的加权函数无法跟随当前信噪比的变化而变化,这种加权函数无法抵御较大的背景噪声和混响,并且当语音信号能力较小时,所述加权函数的取值非常大,后续确定时延会产生很大误差。而在本发明实施例中,步骤S103所确定的加权函数随当前信噪比变化而做出相应调整,使得加权函数的函数值不会因为语言信号能量较小时而变得非常大,迸而保证的确定时延的精确度。步骤S105、根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。声源定位技术的原理是通过确定声源信号到达两个麦克风的时延,井根据所述麦克风的具体位置,通过几何模型确定声源具体位置,本实施例在确定了较高精确度的时延后,可以通过几何分析方法精确定位声源位置,具体的定位方法与现有声源定位技术相同,此处不再赘述。本发明实施例与现有声源定位技术的主要区别在于,本实施例提供的加权函数随当前信噪比变化而相应调整,使得加权函数的函数值不会因为当前信噪比改变而发生剧烈改变,这样最后确定的时延值的精确度得到了保证,进而提高了声源定位精确度。实施例ニ :图2示出了本发明第二实施例提供的声源定位方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。本发明实施例提供的声源定位方法包括步骤S201、麦克风阵列采集声源信号;步骤S202、对所述麦克风阵列中任意两个麦克风采集的声源信号进行带通滤波,得到两路带通滤波后的声源信号;步骤S203、对所述两路带通滤波后的声源信号进行加窗分帧处理,得到两路短时
平稳信号。上述步骤S201-S03作为实施例一中步骤SlOl的ー种具体优选的实施方式。在步骤S201中,假设所述两个麦克风采集到的声源信号分别为X1 (t) = B1S1 (t) +Ii1 (t) (I)x2 (t) = B2S1 (t+D) +n2 (t) (2)其中,ai、a2为声音衰减因子,由于是声源为近场信号,可以认为ai、a2为1,D为声源信号到达所述两个麦克风的时延,ηια)、η2α)为所述两个麦克风接收到的噪声信号。在步骤S202中,对麦克风采集到的声源信号进行带通滤波,将低频段和高频段的噪声滤除,为后续处理提供两路带通滤波后的声源信号。在步骤S203中,作为ー种实现方式,使用汉明窗函数对所述两路带通滤波后的声源信号进行分帧,得到两路短时平稳信号,加窗分帧一般采用帧与帧重叠的方法。两路短时平稳信号为S1 ( λ , n) = X1 (n+d( λ -I)N) w(η) (3)s2 ( λ , η) = X2 (n+d( λ-I)N) w(η) (4)其中w(n)为汉明窗函数,N为窗函数w(n)的长度,d为相邻帧之间的移位參数,λ为帧数。步骤S204、通过端点检测判断所述的两路短时平稳信号是否为语音信号;是执行步骤205 ;否执行步骤207。步骤S205、确定当前信噪比,当前信噪比为SNR(A) = aSNR( λ-l) + (l-a) SNR_0,其中SNR(A-I)为上ー帧声源信号信噪比,SNR_0为使用当前语音信号帧与前ー非语音信号帧的能量比值求得的先验信噪比,a为平滑因子;
步骤S206、对所述两路短时平稳信号进行快速傅里叶变换,再确定所述两路短时平稳信号的互功率谱密度函数;步骤S207、舍弃所述两路短时平稳信号,更新信噪比SNR(A ) = SNR (λ -I),其中SNR(A-I)为上ー帧声源信号信噪比,本流程结束,进入下一帧处理;上述步骤S204-S207是实施例一中步骤S102 —种具体优选的实施方式。步骤S204中通过端点检测来判断两路短时平稳信号是否为语音信号,本实施例中,麦克风采集到的声源信号包括声源的语音信号和背景 噪声信号,若所述声源不发声时,所述麦克风采集到的声源信号仅仅为背景噪声信号,具体的,当检测所述两路短时平稳信号的短时能量(音频信号一个短时间段的能量)和短时过零率(単位时间内信号波形穿过横轴(零电平)的次数)均大于相应的阈值时,即可判定当前声源信号为语音信号。在确定分巾贞后的声音信号第λ巾贞为非语音信号时,则当前信噪比SNR(X)=SNR(X-I) (8)在确定分帧后的声音信号第λ帧为语音信号时,则当前信噪比SNR(A) = aSNR(A-l) + (l-a)SNR_0 (9)其中,SNR(λ -I)为上ー帧的信噪比,SNR_0为当前语音信号帧与前ー非语音信号帧的能量比值,a为平滑因子。当确定当前声源信号为语音信号时,对所述两路短时平稳信号进行快速傅里叶变
换,再确定所述两路短时平稳信号的互功率谱密度函数。具体的,对式(3)和式(4)中的两
路声音信号进行快速傅里叶变换,有
n-ιr\S] \λΛ) = y ,.S- [Λ,n)exp -j —-nk(5 )
n=0
n-ι( 2π \
4(ん灸)= 2^2(ん,OexP -J^rrnk(6)
H=O\ W )因此,可以求得所述两路声音信号的互功率谱密度函数为
Ru(A^k) = Sl(AJi)Sl(AJ)(7)其中,8ι(λ, η)和S2U,η)为长度为N的有限长序列,经过傅里叶变换后得到
S1(λ,k)和 S2(λ,k),S2 (/I,ん)为 S2 (λ,k)的共轭函数。当确定当前两路短时平稳信号为非语音信号时,舍弃所述两路短时平稳信号。当检测到所述两路短时平稳为非语音信号时,此时没有必要再进行后续的运算,因此步骤S207中舍弃所述两路短时平稳,这样在一定程度上就減少了计算量。步骤S208、根据所述当前信噪比确定加权函数^KW)=I , , \、Ρ 7ΓΤ或者MW= , /、,,,其中小12( )为声源信号的互功率谱密度函数,P为与当前信噪比
Φ'ιい个,)SNR(A)成正比关系的调节因子
权利要求
1.一种声源定位方法,其特征在于,所述方法包括 麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理; 确定经过所述预处理后的两路声源信号的互功率谱密度函数; 确定随当前信噪比变化而调整的加权函数; 根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延; 根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。
2.如权利要求I所述方法,其特征在于,所述麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理步骤,具体包括 麦克风阵列采集声源信号; 对所述麦克风阵列中任意两个麦克风采集的声源信号进行带通滤波,得到两路带通滤波后的声源信号; 对所述两路经过带通滤波的声源信号进行加窗分帧处理,得到两路短时平稳信号。
3.如权利要求2所述方法,其特征在于,所述确定经过所述预处理后的两路声源信号的互功率谱密度函数步骤,具体包括 通过端点检测判断所述两路短时平稳信号是否为语音信号; 当判断是时,确定当前信噪比,所述当前信噪比为SNRU) = aSNR(A-l) + (l-a)SNR_0,其中SNRU-1)为上一帧声源信号信噪比,SNR_0为使用当前语音信号帧与前一非语音信号帧的能量比值求得的先验信噪比,a为平滑因子; 对所述两路短时平稳信号进行快速傅里叶变换,再确定所述两路短时平稳信号的互功率谱密度函数; 当判断否时,舍弃所述两路短时平稳信号,并更新信噪比SNR( λ ) = SNR( λ -I),其中SNR ( λ -I)为上一巾贞声源信号信噪比。
4.如权利要求3所述方法,其特征在于,当所述声源信号的短时能量和短时过零率均大于相应的阈值时,即可判定当前声源信号为语音信号。
5.如权利要求4所述方法,其特征在于,所述确定随当前信噪比变化而调整的加权函数步骤,具体包括 根据所述当前信噪比确定加权函数炉 或者 其中Φ12( )为声源信号的互功率谱密度函数,P为与当前信噪比SNR( λ)成正比关系的调节因子, 为相干函数,其中Φι(¥)和φ 为所述两路声源信号的自相关函数。
6.如权利要求5所述方法,其特征在于,所述根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延步骤,具体包括 将所述互功率谱密度函数与加权函数的乘积经过傅里叶逆变换得到所述两路声源信号的互相关函数的值序列; 对所述互相关函数的值序列进行峰值检测,得到最大值点对应的抽样点,并根据抽样点间隔时间确定所述声源信号到达所述两个麦克风的时延。
7.一种声源定位装置,其特征在于,所述装置包括 麦克风阵列采集预处理单元,用于麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理; 互功率谱密度确定单元,用于确定经过所述预处理后的两路声源信号的互功率谱密度函数; 加权函数确定单元,用于确定随当前信噪比变化而调整的加权函数; 时延确定单元,用于根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延; 声源定位单元,用于根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。
8.如权利要求7所述装置,其特征在于,所述麦克风阵列采集预处理单元包括 麦克风阵列采集模块,用于麦克风阵列采集声源信号; 带通滤波模块,用于对所述麦克风阵列中任意两个麦克风采集的声源信号进行带通滤波,到两路带通滤波后的声源信号; 分帧处理模块,用于对所述两路经过带通滤波的声源信号进行加窗分帧处理,得到两路短时平稳信号。
9.如权利要求8所述装置,其特征在于,所述互功率谱密度确定单元包括 语音判断模块,用于通过端点检测判断所述预处理后的当前帧声源信号是否为语音信号; 当前信噪比确定模块,用于当判断是时,确定当前信噪比,所述当前信噪比为SNRU)=aSNRU-l) + (l-a)SNR_0,其中SNR(A-I)为上一帧声源信号信噪比,SNR_0为使用当前语音信号帧与前一非语音信号帧的能量比值求得的先验信噪比,a为平滑因子; 互功率谱密度确定模块,对所述两路短时平稳信号进行快速傅里叶变换,再确定所述两路短时平稳信号的互功率谱密度函数; 信号舍弃模块,用于当判断否时,舍弃所述两路短时平稳信号,并更新信噪比SNRU)=SNRU-1),其中SNRU-I)为上一帧声源信号信噪比。
10.如权利要求9所述装置,其特征在于,所述加权函数确定单元包括 加权函数确定模块,用于根据所述当前信噪比确定加权函数为
11.如权利要求10所述装置,其特征在于,所述时延确定单元包括 互相关函数获取模块,用于将所述互功率谱密度函数与加权函数的乘积经过傅里叶逆变换得到所述两路声源信号的互相关函数的值序列; 时延确定模块,用于对所述互相关函数进行峰值检测,得到最大值点对应的抽样点,并根据抽样点间隔时间确定所述声源信号到达所述两个麦克风的时延。
全文摘要
本发明适用于声音处理技术领域,提供一种声源定位方法及装置,所述方法包括麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中任意两个麦克风的时延,定位声源位置。本发明采用的加权函数能够随当前信噪比的变化做出相应调整,使得在声源信噪比改变的环境下,通过相应调整加权函数,亦可准确获取声源信号的时延,提高了声源定位精度。
文档编号G01S5/22GK102854494SQ201210281019
公开日2013年1月2日 申请日期2012年8月8日 优先权日2012年8月8日
发明者彭迎标, 邵诗强 申请人:Tcl集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1