一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法_2

文档序号:9909619阅读:来源:国知局
>[0031]
[0032]
[0033]
[0034] 其中IujQi,ΩΟ,ΙνΧΩ!,Ω2)和^(Ω!,Ω2)分别是u通道与〇通道,v通道与〇通 道,w通道与〇通道的BISDR值。以I UQ( Ω1; Ω2)为例,推导BISDR与语者声源D0A的关系如下。 把(5)和(8)代入(9)中得到
[0035] Iu〇( Ωχ, Q2)=Us+eu( Ωχ, Ω2) (12)
[0036] 其中
[0037]
[0038] 同理可得:
[0039] Ιν〇( Ωχ, Ω2)=ν8+εν( Ωχ, Ω2) (14)
[0040] Iw〇( Ωχ, Q2)=Ws+ew( Ωχ, Ω2) (15)
[0041 ] 其中
[0042]
[0043]
[0044] Β ISDR的数据模型的矩阵形式如下:
[0045] Ι( Ωι, Q2)=b(9s, φ8)+ε( Ωι, Ω2) (18)
[0046] 其中
[0047] Ι( Ω ι,Ω 2) = [Iu0( Ω ι,Ω 2),Ινο( Ω ι,Ω 2),Iw0( Ω ι,Ω 2) ]τ (19)
[0048] b(9s,(J)s) = [us,vs,ws]T (20)
[0049] ε( Ωχ, Q2) = [eu( Ωχ, Ω2),εν( Ωχ, Ω2),εψ( Ωχ, Ω2)]τ (21)
[0050] 在频率点(Ω ι, Ω 2)处,当满足·时,可以得到ε ( Ω ι, Ω 2)接 近〇,我们将这些点称为高信干比频率点。在这些高信干比频率点,干扰噪声的影响很大程 度上被降低,于是可从BISDR中得到语音声源的D0A相关信息b( 0S,φ s)。
[0051] 为了提取上述高信干比频率点,本发明通过迭代算法估计了先验双谱信干比ξ
(Ω1; 並W卟彳+曾了丨一小蜥谱播瞄谱m( Ω1; Ω2),表示如下:
[0052] (22)
[0053] 将其与BISDR数据矢量Ι( Ω1; Ω2)相乘,提取到具有高信干比的BISDR数据矢量 /(岛沿2)如下:
[0054] /(?>,.£>->) = /;;(£ >hΩ-,) · /(Ω,..Q?) (*> )
[0055] 由上述分析可得以下近似:
[0056]
[0057] 由此,利用核密度估计法,对进行聚类,聚类结果即为(ΙΛΛ)。根据上文 对于us,v4Pws的定义,语者声源的DOA R可估计如下:
[0058]
【主权项】
1. 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源DOA估计方法,包括如下步 骤: (a) 采用单个声学矢量传感器,即Acoustic Vector Sensor(AVS),采集四通道语音信 号,通过模数转换器获得四通道数字信号输出,包括〇-通道信号、u-通道信号、V-通道信号 和w-通道信号;分别计算每一通道数字信号的双谱变换,获得四通道双谱数据; (b) 计算传感器之间的双谱数据比值,即分别计算出u-通道双谱信号、V-通道双谱信号 和w-通道双谱信号与〇-通道双谱信号的比值,简写为BISDR值(Bispectrum Inter-Sensor Data Ratio),分别表示为Ι^Ω!,ΩΟ,Ι^Ω!,ΩΟ,Ι^^Ω!,Ω2),用BISDR值构成3X1 的 BISDR数据矢量ΚΩ:,Ω2); (c) 通过迭代估计先验双谱信干比,计算得到一个双谱掩膜谱; (d) 通过掩膜方式将双谱掩膜谱与BISDR数据矢量I ( Ω :,Ω 2)相乘,提取具有高信干比 的BISDR数据矢量/'(Ω,ΑΟ: (e) 利用核密度估计方法,即Kernel Density Estimation(KDE),对?(Ω:ι,?2):进行聚类, 并利用聚类结果计算所对应的语者声源到达方向,即Direction of Arrival(DOA)。2. 根据权利要求1所述的一种基于声学矢量传感器和双谱变换的鲁棒单语者声源DOA 估计方法,其特征在于,该方法使用的声学矢量传感器是由三个正交放置的同相位压力梯 度传感器以及一个全向压力传感器组成且同位放置,由该四个传感器构成的AVS整体结构 紧凑、尺寸小。3. 根据权利要求1所述的一种基于声学矢量传感器和双谱变换的鲁棒单语者声源D0A 估计方法,其特征在于,所述步骤(a)对采用的四通道数据进行双谱变换,由于语音和非语 音干扰信号在双谱上具有很明显的区分性,且高斯噪声的双谱为零,因此本发明所提出方 法对噪声和非语音干扰具有良好的鲁棒性。4. 根据权利要求1所述的一种基于声学矢量传感器和双谱变换的鲁棒单语者声源D0A 估计方法,其特征在于,所述步骤(b)中对各传感器接收信号的双谱求其数据比值,即BISDR 值,抑制了混响分量,提高了本发明提出方法的混响鲁棒性。5. 根据权利要求1所述的一种基于声学矢量传感器和双谱变换的鲁棒单语者声源D0A 估计方法,其特征在于,所述步骤(c)中利用计算得到的双谱掩膜谱来提取BISDR中的高信 干比频率点,抑制了噪声和非语音干扰的影响,提高了本发明提出方法的噪声和非语音干 扰鲁棒性。6. 根据权利要求1所述的一种基于声学矢量传感器和双谱变换的鲁棒单语者声源D0A 估计方法,其特征在于,所述步骤(d)是利用核密度估计法对提取的高信干比频率点进行聚 类,g卩/ (ΩκΩ:),将D0A估计问题转化为聚类问题,然后计算对应的D0A估计值。
【专利摘要】本发明提供了一种基于声学矢量传感器和双谱变换的鲁棒单语者声源DOA估计方法。所述方法采用声学矢量传感器Acoustic?Vector?Sensor(AVS),实现四通道语音信号采集,并对采集到的数据进行双谱变换,求其对应的双谱数据。利用双谱上AVS接收分量之间的三角函数关系,计算AVS传感器分量间的数据比。通过计算双谱掩膜谱,提取高信干比频率点,利用KDE方法对其聚类,在此基础上,计算得到语音声源的到达方向Direction?of?Arrival(DOA)。本发明所述方法在不同的房间混响、干扰噪声种类、干扰噪声强度的条件下,能够高精度地估计出语者声源的DOA。此外,该发明方法采用的体积仅有1cm3的AVS传感器非常适用于便携设备上的语音技术应用。
【IPC分类】G01S3/78
【公开号】CN105676167
【申请号】CN201610022499
【发明人】邹月娴, 金彦含
【申请人】北京大学深圳研究生院
【公开日】2016年6月15日
【申请日】2016年1月13日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1