一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法与流程

文档序号:12061881阅读:378来源:国知局
一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法与流程

本发明涉及到利用麦克风阵列对声源进行角度估计,更具体地讲,涉及到一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法。



背景技术:

基于麦克风阵列利用声源到达麦克风阵元的时延差进行角度估计是声源角度估计中常用的技术。目前有大量的方法关注在准确的时延差估计上,衍生出各种互相关算法,包括广义互相关方法、相位变换广义互相关方法(PHAT-GCC)、基于联合可控响应功率与相位变换相结合的方法(SRP-PHAT)等等。这些算法依赖于较高的声源信号信噪比,在一定程度上提高了时延估计的准确性,但未考虑到由于声源信号的多径效应带来的时延估计的偏差。



技术实现要素:

本发明为了克服现有技术的不足,而提供一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法。本发明方法能够实时、有效地解决声源角度估计问题。在一定程度上降低了多径效应、混响等信号对角度估计的干扰,提高了角度估计的精度和稳定性。

为了达到上述目的,本发明采用技术方案如下:

一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法,具体步骤如下:

1)在麦克风阵列能够估计的角度范围内,任选一点做声源参考点;

2)麦克风阵列利用声源到达麦克风阵元之间的时延差,根据已知几何关系,对声源参考点进行角度粗估计;

3)将角度粗估计的结果进行统计分析,得出当前环境下受噪声和多径效应影响的角度分布的概率密度函数f(θl);

4)对当前环境中麦克风阵列能够估计的角度范围内的待估计声源,进行角度粗估计后,应用概率密度函数f(θl)进行角度估计后的滤波处理,将滤波后的峰值点横坐标作为角度估计的结果。

所述步骤3)得出角度分布的概率密度函数f(θl),具体方法包括:

3-1)对角度粗估计结果进行统计后,按照角度出现的频次,绘制角度分布直方图;

3-2)对直方图进行拟合,得出角度分布的概率密度函数f(θ);

3-3)考虑到声源参考点任意选取,将概率密度函数f(θ)扩展到麦克风阵列能够估计的角度范围内,有概率密度函数f(θl),其中l=1,2,3,...K,根据所需要的角度估计的分辨率,自定义K的大小。

所述步骤4)应用概率密度函数f(θl)进行角度估计后的滤波处理,具体方法包括:

4-1)计算一对麦克风语音帧各个频点上的时延差,并构成时延数组τ[N],根据几何关系得到时延数组τ[N]对应的角度数组A[N];若麦克风阵列包含M个麦克风,则以两两麦克风为一组,构成麦克风组数为因两两麦克风之间得出一个角度估计,麦克风阵列得出的角度数组为

4-2)根据所需要的角度估计的分辨率,对角度数组A[N]中的N个数据,或对角度数组中的个数据,选取对应的概率密度函数曲线f(θl);

4-3)将步骤4-2)中的N条或条概率密度函数曲线进行叠加,得到混合概率密度函数曲线;

4-4)若上述曲线仅有一个最大值,则将该最大值的横坐标作为角度估计的本次滤波的结果;若上述曲线有多个等高最大值,则将所有最大值的横坐标相加后取均值作为本次滤波的结果。

与现有技术相比,本发明具有如下突出的实质性特点和显著的优点:

本发明方法考虑到多径效应对时延估计的影响,假设由时延估计所得的角度估计结果会呈现一种概率分布。通过统计角度估计的结果,得出了受多径影响的角度分布及其概率密度函数,利用角度分布的概率密度函数曲线,对角度估计结果进行滤波,从而提高了角度估计的精度。

附图说明

图1是本发明的实施流程图。

图2是本发明中第一实施例的实现框图。

图3是本发明中第二实施例的实现框图。

具体实施方式

下面通过具体的实施例并结合附图对本发明做进一步的描述。

实施例一:如图1和图2所示,本实施例一种基于概率分布的麦克风阵列角度估计后置滤波器设计方法,该方法操作步骤如下:

1)在麦克风线性阵列可估计的角度范围内,任选一点做声源参考点;

2)麦克风线性阵列利用声源到达麦克风阵元之间的时延差,根据已知几何关系,对声源参考点进行角度粗估计;

3)将角度粗估计的结果进行统计分析,得出当前环境下受噪声和多径效应影响的角度分布的概率密度函数f(θl),具体为:

3-1)对角度粗估计结果进行统计,按照角度出现的频次,绘制角度分布直方图;

3-2)对直方图进行拟合,得出角度分布服从高斯分布,且其概率密度函数为f(θ);

3-3)考虑到声源参考点任意选取,将概率密度函数f(θ)扩展到麦克风线性阵列可估计的角度范围内(0到180度),选取角度估计的分辨率为1度,有概率密度函数f(θl),其中l=1,2,3,...180;

4)对当前环境中麦克风阵列能够估计的角度范围内的待估计声源,进行角度粗估计后,应用概率密度函数f(θl)进行角度估计后的滤波处理,将滤波后的峰值点横坐标作为角度估计的结果,具体为:

4-1)对当前环境下,粗估计一对麦克风语音帧各个频点上的时延差,并以其构成时延数组τ[N],根据几何关系可得到时延数组τ[N]对应的角度数组A[N];

4-2)根据所需要的角度估计的分辨率,对角度数组A[N]中的N个数据,选取对应的概率密度函数曲线f(θl);

4-3)将上述的概率密度函数曲线进行叠加,得到混合概率密度函数曲线;

4-4)因上述曲线中仅有一个峰值,故将该峰值的横坐标作为该语音帧两两麦克风对声源的角度估计结果。

实施例二:如图3所示,本实施例与实施例一基本相同,可采用同一组角度分布的概率密度函数f(θl),其特别之处如下:以四元线性麦克风阵列为例,所述步骤4-4)得出的结果仅为一对麦克风在一帧语音帧下得到的角度估计结果,而按照两两麦克风选取,该麦克风阵列在实际每帧语音帧下可得出个角度估计结果,考虑到角度估计稳定性,通常选取8帧语音帧作为一次统计,据此可得到共48个数据,将此48个数据作为角度数据组B[48],再次进行步骤4);根据所需要的角度估计的分辨率,对角度数组B[48]中的48个数据,选取对应的概率密度函数曲线f(θl);将上述步骤中的概率密度函数曲线进行叠加,得到混合概率密度函数曲线;因上述曲线中仅有一个峰值,故将该峰值的横坐标作为4元线性麦克风阵列在一次角度估计中得出的角度结果。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1